Elasticsearch Relevance Engine™の概要 - AIを革新する高度な検索

blog-720x420_(1).png

本日は、関連性に優れたAI検索アプリケーションを作成するための新機能、Elasticsearch Relevance Engine(ESREについてご紹介します。ESREは、検索におけるElasticのリーダーシップと2年以上にわたる機械学習の研究開発を基盤としたものです。AIの最も優れた部分とElasticのテキスト検索を融合させており、洗練された検索アルゴリズムスイートと、大規模言語モデル(LLM)との統合機能を開発者にお届けします。さらに、Elasticのコミュニティから既に大きな信頼が寄せられているシンプルかつ統合されたAPIを使ってアクセスできるため、世界中の開発者が検索の関連性を高めるためにすぐに使い始めることができます。

Video thumbnail

Elasticsearch Relevance Engineの構成可能な機能を利用すると、以下のような形で関連性を向上させることができます。

  • ハイブリッド検索の必須要素であるBM25fなど、高度な関連性順位付け機能を利用する
  • Elasticのベクトルデータベースを利用して高密度埋め込みを作成、格納、検索する
  • 広範な自然言語処理(NLP)タスクおよびモデルを使用してテキストを処理する
  • Elasticで独自の変換器モデルを管理および使用して、ビジネス固有のコンテキストに対応できるようにする
  • API経由でOpenAIのGPT-3やGPT-4といったサードパーティの変換器モデルと連携し、Elasticsearch環境に統合されたお客様のデータストアからコンテンツの直感的な要約を読み出す
  • Elasticの設定不要なLearned Sparse Encoderモデルによりモデルの教育や保守をすることなく機械学習ベースの検索を導入し、幅広い領域をまたいだ関連性の高いセマンティック検索を実現する
  • ハイブリッドな順位付け手法である逆順位融合(RRF)により低密度検索と高密度検索を容易に組み合わせ、自然言語クエリタイプとキーワードクエリタイプの組み合わせに応じてAI検索エンジンを最適化する
  • LangChainなどのサードパーティ製ツールと統合し、高度なデータパイプラインや生成的AIアプリケーションの構築を支援する

「関連性を高めたい」、「検索アプリケーションのエクスペリエンスを改善したい」。検索の分野で絶えず進化の原動力としての役割を果たしてきたのは、このようなニーズです。関連性の高い検索結果を返すことができれば、検索アプリに対するユーザーエンゲージメントが高まり、収益と生産性の両面で大きな効果が期待できるからです。しかし、LLMと生成的AIが登場した現在、検索はさらに大きな進歩を遂げています。ユーザーの意図を理解したうえで、これまでにないレベルの具体性を備えた回答が得られるようになっているのです。

検索は、進化のたびにその関連性を高めていきます。しかし、新たなテクノロジーやユーザー行動の変化がもたらす新たな課題に対応することも欠かせません。キーワード検索を拡張してセマンティック検索を提供するにせよ、動画や画像に対する新たな検索手法を実現するにせよ、新しいテクノロジーで検索ユーザーに優れたエクスペリエンスを提供するためには、それに対応したツールが必要です。同じように、人工知能が隆盛を迎えた今日の世界では、お客様の評価を経た実績ある機能を備えた技術スタック上に構築された、拡張性の高い新たな開発者ツールキットが必要です。

生成的AIが勢いづき、ChatGPTなどの技術の採用が進むとともに、大規模言語モデルの機能に対する認知も進んでいる現在、開発者の間では、アプリケーション改善のために各種のテクノロジーを試したいという熱が高まっています。Elasticsearch Relevance Engineは、この生成的AIの世界に新時代の機能をもたらし、開発者チームがすぐに使える強力なツールを提供します。

Elasticsearch Relevance Engineの新機能はすべて、Elasticが最新リリースを提供する唯一のマネージドサービス、Elastic Cloudで今すぐ使いはじめることができます。またElastic Stackをダウンロードして、あるいはクラウドオーケストレーションプロダクトとして提供されるElastic Cloud EnterpriseやElastic Cloud for Kubernetesを活用して、セルフマネージドでお使いいただくことも可能です。

生成的AIモデルの限界を克服

Elasticsearch Relevance Engine™は、開発者の迅速な進歩を促し、生成的AIを含めた自然言語検索の次のような課題に対応するうえで役立ちます。

  1. エンタープライズデータ/コンテキストを認識モデルに特定領域に関する十分な知識を組み込めていない可能性がありますこの原因は、モデルを教育するデータセットにあります。LLMが生成するデータやコンテンツをカスタマイズするには、なんらかの方法でモデルに独自のデータを供給し、LLMがビジネスに特化した関連性の高い情報を提供できるようにする必要があります。
  2. 関連性の向上:Elasticsearch Relevance Engineを使用すると、プライベートソースからのデータ統合も、ベクトル埋め込みを生成して保存し、セマンティック検索を使用してコンテキストを取得する作業も、シンプルに進めることができるようになります。ベクトル埋め込みとは、単語、フレーズ、文書を数値として表現したもので、LLMが単語の意味やその関係を理解するのに役立ちます。このベクトル埋め込みを使うと、変換器モデルの出力を迅速かつ大規模に行えるようになります。また、ESREでは、開発者が独自の変換器モデルをElasticに持ち込んだり、サードパーティ製のモデルと統合したりすることもできます。

    また、レイトインタラクションモデルが登場したことで、サードパーティのデータセットに対して大規模な教育や微調整を実施しなくても、すぐに関連性を向上できるようになっています。すべての開発チームが機械学習モデルの教育や保守を行うリソースや専門知識を持っているわけでも、スケール、パフォーマンス、スピードのトレードオフを理解しているわけでもないため、Elasticsearch Relevance Engineには、さまざまな領域に対応したセマンティック検索用に構築された検索モデルであるElastic Learned Sparse Encoderも含まれています。このモデルでは、低密度埋め込みと従来のキーワードベースのBM25検索を組み合わせ、ハイブリッド検索用の使いやすい逆順位融合(RRF)スコアラーを実現します。ESREを使うことで、開発者は機械学習ベースの関連付けやハイブリッド検索の手法を初日から利用できるようになります。
  3. プライバシーとセキュリティ:ネットワーク上やコンポーネント間で機密データを使用したり安全に受け渡したりするうえで重要になるのが、データのプライバシーです。このことは、企業が革新的な検索エクスペリエンスを構築する場合でも変わりません。

    Elasticではロールベースと属性ベースのアクセス制御をネイティブにサポートしており、チャットアプリや質問回答アプリであっても、データへのアクセス権を持つロールだけがデータを表示できるようになっています。Elasticsearchは、特権を持つユーザーだけが特定のドキュメントにアクセスできるようにしたいという組織のニーズに応え、組織全体ですべての検索アプリケーションにわたってプライバシーとアクセス制御を維持できるようになっています。

    プライバシーが最大の懸念事項である場合、すべてのデータを組織のネットワーク内で管理することが、最優先事項であるだけでなく、義務となる場合もあります。エアギャップ環境でのデプロイ実施から、安全なネットワークへのアクセス支援まで、ESREはお客様の組織がデータの安全性を維持するために必要なツールを提供します。
  4. サイズとコスト:大企業では、データ量も計算能力とメモリの所要量も膨大になるために、大規模言語モデルの利用が非常に高額になることが少なくありません。しかし、チャットボットのような独自の生成的AIアプリの構築を目指すのであれば、LLMと自社のプライベートデータを組み合わせる必要があります。

    Elasticsearch Relevance Engineは、手間や費用をかけずにデータフットプリントを削減できる精密なコンテキストウィンドウを備えており、企業が効率的に高い関連性を実現するうえで役立ちます。
  5. データの鮮度:モデルは教育用データが収集された時点で時間的に止まってしまいます。つまり、生成的AIモデルが作成するコンテンツやデータは、教育に使ったデータと同じ鮮度しかないことになります。LLMからタイムリーな結果を引き出すためには、企業データを統合することが不可欠です。
  6. 幻想:モデルに質問したり、モデルと会話したりしていると、説得力があり信頼できるように聞こえるものの、実際には事実ではなく予測であるような回答が返ってきたりします。これも、モデルをビジネス環境で役立てるためには、文脈に即してカスタマイズされた知識に基づいてLLMを使用する必要があるもう1つの理由です。

    Elasticsearch Relevance Engineを使用すると、開発者は生成的AIモデルのコンテキストウィンドウを介して独自のデータストアにリンクできます。検索結果が追加されることで、プライベートな情報源や専門領域の最新情報を提供できるため、情報を求められたときに、モデルのいわゆる"パラメトリックな"知識のみに頼るのではなく、より事実に近い情報を返すことができるようになります。

ベクトルデータベースによる強力な支援

Elasticsearch Relevance Engineには、回復力の高い運用グレードのベクトルデータベースを搭載した設計になっています。これにより、開発者はリッチでセマンティックな検索アプリケーションを構築するための基盤を得ることができます。Elasticのプラットフォームを利用することで、開発チームは高密度ベクトル検索を使って、キーワードや同義語にとらわれない、より直感的な質問応答を実現できます。画像などの非構造化データを利用したマルチモーダル検索を構築し、さらにユーザープロファイルをモデル化して一致させることで、製品や発見、求人検索、マッチングなどのアプリケーションで検索結果をパーソナライズすることができます。これらのNLP変換器モデルにより、センチメント分析、固有表現抽出、テキスト分類などの機械学習タスクも可能になります。Elasticのベクトルデータベースを使用すると、開発者は実際の運用アプリケーションで高いスケーラビリティと性能を発揮する埋め込みの作成、格納、クエリを実行することができます。

Elasticsearchは、関連性の高い検索結果の取得を得意としています。Elasticsearchは、ESREを通じて、企業の独自データにリンクされたコンテキストウィンドウを生成的AIに提供するため、魅力的でより正確な検索エクスペリエンスを構築できるようになります。検索結果は、ユーザーの元のクエリに従って返されますが、開発者はそのデータを好みの言語モデルに渡すことで、追加のコンテキスト含む回答を提供することができます。Elasticは、お客様のビジネス向けにカスタマイズされたプライベートなエンタープライズコンテンツストアにある、関連性の高いコンテクストデータを使用して、質問回答機能やパーソナライゼーション機能を強化します。

そのまま使える優れた関連性をすべての開発者に提供

Elasticsearch Relevance Engineのリリースによって、Elasticの独自検索モデルを容易に利用できるようになりました。このモデルは簡単にダウンロードでき、Elastic Webクローラーコネクター、APIなどのあらゆるインジェスチョンメカニズムで動作します。検索可能なコーパスで設定なしに使うことができるほか、ノートPCのメモリ内に収まるくらいのコンパクトなサイズです。ElasticのLearned Sparse Encoderは、ナレッジベース、学術雑誌、法的証拠開示、特許データベースなどの検索ユースケースにおいて、領域をまたいだセマンティック検索を提供し、適合や教育を必要とせずに関連性の高い検索結果をもたらします。 

実際のテストでは、ハイブリッド順位付け手法が最も関連性の高い検索結果セットを生成していることがほとんどです。これまでは、RRFという重要な構成要素が欠けていたのです。 アプリケーション検索のニーズに対応するためにRRFを搭載することで、ベクトル検索機能とテキスト検索機能の組み合せが可能になりました。 

機械学習は、検索結果の関連性をセマンティックなコンテキストによって強化する最先端の技術ですが、そのコスト、複雑さ、リソースの要件から、多くの場合、開発者は効果的に実装することができませんでした。開発者は通常、関連性の高いAIベースの検索を構築するために、専門の機械学習チームやデータサイエンスチームのサポートを受ける必要があります。これらのチームは、適切なモデルの選択、領域固有のデータセットでの教育、データとその関係の変化によるモデルの進化に伴う保守に相当な時間を費やしています。

Go1がElasticのベクトルデータベースを使用して、スケーラブルなセマンティック検索を実現した方法をご確認ください

開発者が専門チームのサポートを受けられない場合でも、代替手段に必要な労力や専門知識を必要とせずに、セマンティック検索を実装し、最初からAIベースの検索関連性の恩恵を受けることができます。つまり、今後はあらゆるお客様が、より適切な関連性と最新鋭のスマートな検索を実現するための構成要素を利用できるのです。

試してみましょう

これらの機能について詳細をお読みください

Elastic Cloudをご利用中のお客様は、ご紹介した機能にElastic Cloudコンソールから直接アクセスできます。Elasticをクラウドでご利用中でない場合は、LLMと生成的AIでElasticsearchを使用する方法をご確認ください

本記事に記述されているあらゆる機能ないし性能のリリースおよびタイミングは、Elasticの単独裁量に委ねられます。現時点で提供されていないあらゆる機能ないし性能は、すみやかに提供されない可能性、または一切の提供が行われない可能性があります。

Elastic、Elasticsearch、Elasticsearch Relevance Engine、ESRE、Elastic Learned Sparse Encoder、および関連するマークは、米国およびその他の国におけるElasticsearch N.V.の商標、ロゴ、または登録商標です。他のすべての会社名および製品名は、各所有者の商標、ロゴ、登録商標である場合があります。