시맨틱 검색이란 무엇인가?

즉시 사용 가능한 구현 또는 맞춤형 구현이 여러분에게 적합한지 알아보세요.

시맨틱 검색의 정의

시맨틱 검색은 단어와 구문의 의미를 해석하는 검색 엔진 기술입니다. 시맨틱 검색의 결과는 쿼리의 단어와 문자 그대로 일치하는 콘텐츠가 아니라 쿼리의 의미와 일치하는 콘텐츠를 반환합니다.

시맨틱 검색은 검색자의 의도와 검색 컨텍스트에서 단어를 이해하는 것을 포함하는 일련의 검색 엔진 기능입니다.

이러한 유형의 검색은 자연어를 보다 정확하고 상황에 맞게 해석하여 검색 결과의 품질을 향상시키기 위한 것입니다. 시맨틱 검색은 머신 러닝인공 지능과 같은 기술의 도움을 받아 검색 의도를 의미론적인 의미와 일치시킴으로써 이를 달성합니다.

시맨틱 검색은 어떻게 작동하는가?

시맨틱 검색은 벡터 검색을 통해 제공되며, 벡터 검색은 시맨틱 검색이 컨텍스트 관련성과 의도 관련성을 기반으로 콘텐츠를 제공하고 순위를 매길 수 있도록 합니다. 벡터 검색은 검색 가능한 정보의 세부 정보를 관련 용어나 항목의 필드 또는 벡터로 인코딩한 후 벡터를 비교하여 어떤 것이 가장 유사한지 결정합니다.

벡터 검색이 가능한 시맨틱 검색은 쿼리 파이프라인의 양쪽 끝에서 동시에 작업하여 결과를 생성합니다. 쿼리가 실행되면 검색 엔진은 쿼리를 데이터 및 관련 컨텍스트의 수치 표현인 임베딩으로 변환합니다. 이는 벡터에 저장됩니다. kNN 알고리즘, 즉 k-최근접 유사 항목(k-nearest neighbor) 알고리즘은 기존 문서의 벡터(텍스트에 관한 시맨틱 검색)를 쿼리 벡터와 일치시킵니다. 그러면 시맨틱 검색은 결과를 생성하고 개념적 관련성을 기반으로 순위를 매깁니다.

  1. 쿼리가 실행되면 검색 엔진은 쿼리를 데이터 및 관련 컨텍스트의 수치 표현인 임베딩으로 변환합니다. 이는 벡터에 저장됩니다.
  2. kNN 알고리즘, 즉 k-최근접 이웃 알고리즘은 기존 문서의 벡터(텍스트에 관한 시맨틱 검색)를 쿼리 벡터와 일치시킵니다.
  3. 그러면 시맨틱 검색은 결과를 생성하고 개념적 관련성을 기반으로 순위를 매깁니다.

컨텍스트
시맨틱 검색에서 컨텍스트는 검색자의 지리적 위치, 쿼리 단어의 텍스트 컨텍스트 또는 검색자의 검색 기록 컨텍스트와 같은 추가 정보를 나타낼 수 있습니다.

시맨틱 검색은 컨텍스트 단서를 사용하여 수백만 개의 예시 데이터 세트에서 단어의 의미를 결정합니다. 시맨틱 검색은 유사한 컨텍스트에서 사용될 수 있는 다른 단어도 식별합니다.

예를 들어, "football"을 검색하면 미국에서는 "축구(soccer)"를 의미하고 영국을 비롯한 세계의 다른 지역에서는 "풋볼(football)"를 의미합니다. 시맨틱 검색은 사용자의 지리적 위치를 기반으로 결과를 구별할 것입니다.

검색자 의도
시맨틱 검색의 역할은 사용자의 경험을 향상시키는 것입니다. 가장 정확도가 높은 결과를 제공할 수 있도록, 사용자의 요구 사항을 이해하기 위해 사용자의 의도를 해석합니다. 사용자가 정보를 원하는가? 사용자가 구매를 하려고 하는가? 쿼리와 해당 컨텍스트를 기반으로, 시맨틱 검색은 관련성 순으로 결과의 순위를 매깁니다.

가장 관련성이 높은 제품을 먼저 생성하고 가장 관련성이 낮은 제품을 나중에 생성하는 등 쿼리 분류 설정을 통해 시맨틱 검색을 수정하거나 개선할 수도 있습니다.

관련: 사용자의 검색 경험을 개인 맞춤 설정

벡터 표현과 임베딩으로의 변환을 포함한 생성형 AI의 단계를 보여주는 다이어그램

시맨틱 검색과 키워드 검색 비교

시맨틱 검색과 키워드 검색의 차이점은 키워드 검색은 단어와 단어, 단어와 동의어, 단어와 유사한 단어가 일치하는 결과를 반환한다는 것입니다. 시맨틱 검색은 쿼리에 포함된 단어의 의미와 일치하는 것을 찾습니다. 어떤 경우에는 시맨틱 검색이 직접적인 단어 일치가 있는 결과를 생성하지 않을 수도 있지만 사용자의 의도와는 일치하게 됩니다.

키워드 검색 엔진은 동의어나 단어 생략과 같은 쿼리 확장 또는 완화 도구를 사용합니다. 또한 오타 허용, 토큰화, 정규화와 같은 자연어 처리 및 이해 도구도 사용합니다. 반면, 시맨틱 검색은 벡터 검색을 통해 의미와 일치하는 쿼리 결과를 반환할 수 있습니다.

‘초콜릿 밀크’를 생각해 보세요. 시맨틱 검색 엔진은 ‘초콜릿 밀크’와 ‘밀크 초콜릿’을 구별할 것입니다. 쿼리의 키워드는 동일하더라도, 쓰여진 순서에 따라 의미가 달라집니다. 인간으로서, 우리는 밀크 초콜릿이 다양한 초콜릿을 가리키는 반면, 초콜릿 밀크는 초콜릿 맛이 나는 우유라는 것을 이해합니다.

기존 검색을 뛰어넘는 경험을 구현하세요. 백서를 읽고 시맨틱 검색을 애플리케이션에 적용하는 가장 좋은 접근 방식을 알아보세요.

시맨틱 검색이 중요한 이유는 무엇인가?

시맨틱 검색은 더 넓은 검색 표면을 용이하게 하기 때문에 중요합니다. 벡터 검색을 기반으로 하기 때문에 시맨틱 검색은 쿼리의 컨텍스트와 더불어 의도가 결과를 산출하는 보다 직관적인 검색 경험을 가능하게 합니다.

시맨틱 검색 알고리즘은 전환율, 이탈률 등 다양한 핵심 성과 지표(KPI)를 통해 계속해서 "학습"하므로, 시맨틱 검색은 사용자 만족도를 높이는 데 도움이 됩니다.

2024년 기술 검색 동향을 자세히 알아보세요. 이 웨비나를 통해 모범 사례, 새로운 방법론, 2024년 개발자에게 영향을 미칠 주요 동향에 대해 알아보세요.

Elasticsearch를 사용한 시맨틱 검색

Elasticsearch 플랫폼에는 시맨틱 검색 모델인 Elastic Learned Sparse EncodeR(ELSER)을 포함한 머신 러닝 및 AI 솔루션이 탑재되어 있습니다. 이 NLP 모델은 배포하기 쉬운 도구에서 시맨틱 검색이 가능하도록 Elastic에 의해 훈련되었습니다.

이 동영상에서 Elastic의 제로샷 인코더 모델에 대해 알아보고, 작동 방식과 왜 이 모델이 AI 검색 앱과 생성형 AI 경험을 위해 시맨틱 검색을 빠르게 구현하는 데 도움이 되는지 알아보세요. Elastic의 머신 러닝 모델은 훈련이 필요하지 않으므로 비용과 시간을 절약할 수 있습니다.

Elasticsearch에 대해 자세히 알아보기

다음에 해야 할 일

준비가 되시면... 비즈니스 데이터에서 인사이트를 활용하는 데 도움이 되는 네 가지 방법을 확인해 보세요.

  1. 무료 체험판을 시작하고 Elastic이 여러분의 비즈니스에 어떻게 도움이 되는지 알아보세요.
  2. Elastic 솔루션을 둘러보고 Elasticsearch Platform이 어떻게 작동하는지, 그리고 여러분의 요구 사항에 어떻게 부합하는지 알아보세요.
  3. 기업에서 생성형 AI를 제공하는 방법을 알아보세요.
  4. 이 기사를 읽고 싶어하는 아는 사람과 공유하세요. 이메일, 링크드인, 트위터 또는 페이스북을 통해 공유하세요.