検索関連性の定義

検索関連性とは、検索エンジンから提供された検索結果がユーザーのクエリと意図にどれだけ合っているかを示す指標です。検索結果の品質は、表示される情報がどれだけ正確にユーザーの期待に合致しているかで決まります。

検索関連性とパフォーマンスを高めるには、言語分析、順位付けアルゴリズム、コンテクスト要素が必要です。そのためには、ユーザー行動分析の結果、位置情報データ、利用頻度、検索履歴などを使用します。検索関連性は顧客エクスペリエンスを大きく左右する要因であり、バランスを適切に調整すれば、企業およびそのユーザーのニーズに合わせて検索を最適化できます。


検索関連性のアルゴリズム

検索関連性は、情報の評価、処理、取得、順位付けを行う複雑なアルゴリズムによって決まります。検索関連性のアルゴリズムでは、キーワードの意味、意図、およびシグナル(エンゲージメントや地理的情報、ユーザーの好みなど)を解読するとともに、ソースの信頼性を評価します。

検索に関連する一般的なアルゴリズムには、以下のものがあります。

TF-IDF(単語頻度・逆文書頻度):キーワードの重要度を評価するために使用され、他のドキュメントと比べて対象のドキュメントに登場する頻度が高い単語ほど重要と評価します。

RankBrain:Googleが開発したAI搭載アルゴリズムであり、機械学習を利用してクエリを解釈および処理することで、読み取りにくく曖昧なことが多いユーザーの意図をより適切に理解できます。

ベクトル空間モデル:ドキュメントとクエリを次元空間にベクトルとして表現し、比較と順位付けを行います。

潜在意味解析:統計的手法により関連する語句やフレーズを処理して、単語どうしの潜在的な関係性を特定します。

自然言語処理(NLP):機械学習の手法であり、検索で使用される人間の言葉の文脈や意味を検索エンジンで適切に把握できるようにします。


検索関連性の主な要素

検索関連性の主な要素としては、キーワード密度やエンゲージメントメトリックなど、さまざまなシグナルが挙げられます。検索エンジンはコンテンツとリンクをクローリングし、データを収集してインデックス化し、各ページに関連度を割り当ててから、膨大な条件に基づいて結果のスコア付け、並び替え、順位付けを行います。その後、検索者が本当に探しているものを提供するために、キーワードや音声のコンテクストを解析しなければなりません。

検索関連性の主な要素には、以下のものがあります。

  • テキスト分析とキーワード関連性
    検索結果を関連性があるものにするには、クエリの語句と記事、ページ、ドキュメント、製品リストの内容を照合するプロセスがきわめて重要です。自然言語の言い回しやシノニム、表記の違い、誤字脱字、地域ごとの表記の揺れ、発音どおりの表記をはじめとして、複雑な要素が多数存在するため、この作業は困難です。
  • コンテンツの品質
    信ぴょう性および正確性に関する評価に基づき、信頼性の高いコンテンツほど高い順位が付けられやすくなります。また、新しいコンテンツほど指定のクエリとの関連性が高いとみなされるため、鮮度も影響します。
  • 単語の重み付け
    重視すべきキーワードを決定する際に、各単語に数値が割り当てられます。検索結果の正確性を保つうえでは、これらの値が重要になります。
  • ユーザーの意図
    アルゴリズムによってユーザーの本当の目的を特定し、明示的な検索クエリとその背後にある意味上のコンテクストの両方に対応できます。
  • パーソナライズとローカライズ
    検索エンジンでは、状況に基づく関連性を利用して、地理的所在地や言語、デバイスの種類、閲覧履歴、検索履歴などのユーザー固有の要素に基づき結果をカスタマイズできます。
  • ユーザーエンゲージメントのメトリック
    クリックスルー率を利用して、ユーザーエンゲージメントを測定できます。結果が0件であった検索や、結果がクリックされなかった検索を調べることで、検索結果に対するユーザーの満足度がわかります。

検索関連性が重要である理由

検索関連性は、ユーザーの満足度を高めるうえで重要です。ユーザーが目的の情報を素早く効率的に見つけることができれば、満足度は大きく高まります。ビジネスにもよりますが、満足度が向上すれば、購入を考えている人が実際に購入する可能性や、偶然サイトを訪問した人が定期的な読者または購入者になる可能性が増加します。また、チームメンバーが割り当てられた仕事を遂行したり、重要な決断を下したりしやすくなります。

Webサイトの閲覧時に直接検索バーを利用するユーザーは43%であり1、検索を行わないユーザーに比べてコンバージョンの確率が3倍高いとされています。ほとんどの企業にとって、検索は未来のクライアントや顧客と最初につながるポイントです。そのため、ユーザーの信頼を得て、関係を築き、収益を高めるには検索がきわめて重要です。社内的に見れば、関連する情報を効率的に提供できれば、時間と労力の節約につながります。

検索関連性が低いとユーザーの不満が高まり、サイトを使うのをやめ、調査に別のチャンネルを利用する可能性があります。このようなユーザーは、二度とサイトに戻ってきません。オンライン小売業者の観点では、購入を考えていたユーザーが目的の商品を見つけられずに去ってしまうということです。検索結果の関連性を高めると、コンバージョン率が向上し、収益が増大します。また、オンラインの小売業者であれば、「こちらの商品も買われています」タブや「類似の商品」タブなどの検索主導のeコマース機能を導入することで、購入される品物の数を増やせます。

コンテンツを制作する企業の場合、検索関連性が高いほど露出度も高まり、幅広いオーディエンスにリーチできます。研究者や医師、学生、専門家の場合、検索結果が正確になればより優れた成果を出せるようになります。


検索関連性の評価方法と測定方法

検索者は、一人ひとりニーズや意図が異なります。関連性を正確に、あるいは体系的に測定するのは困難です。順位付けシステムの情報取得方法を評価するトレーニング済みの変換器であるBenchmarking-IR(BEIR)など、産業用ベンチマークがある程度の目安になります。たとえば、BEIRベンチマークの1つにMS-MARCO(Microsoft Machine Reading Comprehension)があり、質問と回答のデータセットにより検索の有効性を評価できます。これにより検索関連性の指標を得ることはできますが、絶対評価を行う方法はありません。

検索の有効性についてのインサイトを得る方法としては、ユーザー行動の傾向を調査し、傾向を徐々に改善する方法を模索し続けることが挙げられます。

検索の有効性は、ユーザーが適切な情報を検索するうえで検索語句を入力、再入力、修正しなければならなかった回数から測定できます。検索の効率性は、ユーザーが目的の情報を見つけるまでにかかった手間の量で決まります。どちらも、全体的な検索関連性を知る手段となります。また、検索分析により、ユーザーが検索を行う頻度、検索の目的、検索の対象、検索対象を見つけられたかどうかを調べることもできます。

再現率は、関連性のあるレコードの取得件数を関連性のあるレコードの総数で割ったものです。適合率は、関連性のないレコードと関連性のあるレコードの総数に対する関連性のある検索結果の割合です。再現率と適合率はどちらも重要な測定値ですが、評価するには人間がある程度検討、管理しなければならないことが多く、コストがかかります。アンケートや対話形式のボタンでユーザーからフィードバックを収集すると、コストを抑えつつ、検索結果の関連性に対するユーザーの満足度を把握できます。

検索者の行動に関するメトリックを使用すると、間接的ではありますが、明示的でない関連性を評価できます。重要な定量的メトリックの1つとして、検索結果を見たユーザーのうちで結果をクリックしたユーザーの割合を示すクリックスルー率(CTR)があります。CTRが高いほど、関連性が高いと考えられます。また、ドゥエルタイム(ユーザーが検索結果のリンクをクリックして移動したページ上に滞在した時間)も重要な指標であり、コンテンツの関連性と品質が高いほど、この時間は長くなります。一方で、直帰率(ページで操作を行わずに去ったユーザーの割合)からは、コンテンツが期待に沿っていない可能性がわかります。


検索関連性を高める手法

検索関連性の向上は、継続的なプロセスです。最新の機械学習アルゴリズム、自然言語処理機能、表現抽出の導入だけでなく、時間をかけて検索関連性を高める以下のような手法もあります。

  • クエリ理解を拡張する
    検索結果の対象範囲を広げるには、定義とスコープの観点でつながりのある関連語句、またはキーワード同義語(検索語句と同じ意味または近い意味を持つ単語やフレーズ)も含めるようにクエリ理解を拡張しましょう。また、クエリの全体ではなく一部のみに一致している、部分一致の結果も含めるように拡張する方法もあります。自動言語検出を使用して、過去の検索に似たテキストを提案するのもよいでしょう。
  • 誤入力対応を強化する
    誤入力対応を強化すると、ユーザーは語句を間違えて入力しても目的の検索結果を得られるようになります。誤入力対応を実装すれば、ユーザーがクエリを入力しなおす必要がなくなるので、検索の快適性が高まります。完全一致に頼るのではなく、オートコレクト機能やスペルチェック機能を強化して、表記ミスや誤入力の許容力を高めましょう。また、「もしかして:」機能を使い、代わりの検索語句や表記の正しい語句を提案してもよいでしょう。
  • ファセットとフィルターを組み込む
    ファセット(別名スマートフィルター)があると、ユーザーが検索範囲を絞り込みやすくなります。サイトの情報量が多い場合、ファセットとフィルターは特に役立ちます。場所、トピック、価格、カテゴリー、日付などの関連属性に応じてフィルターを自動で検出するか、ユーザーがこれらの属性を基に検索結果を絞り込めるようにしましょう。
  • パーソナライズを導入する
    ユーザーの好み、場所、検索履歴、購入履歴、行動に応じて検索結果をカスタマイズすることで、関連性を高められます。関連性の高い検索結果ほど上位になるように順位付けし、結果をユーザーごとに調整しましょう。パーソナライズは、ユーザーの過去の検索内容から将来のニーズを読む予測検索でも重要な役割を果たします。
  • ユーザーのフィードバックを利用する
    検索結果の品質についてユーザーからフィードバックを募ることで、検索エンジンに学習させ、改善できます。ユーザーのフィードバックは、実際の検索関連性を測定する一番の手段です。フィードバックを活用すれば、検索エンジンを継続的に改善できます。
  • UXを最適化する
    古いページ、重複しているコンテンツ、使われていないキーワードやタグ、リンク切れのリンクを削除して、サイトを整理しましょう。検索バーを見つけやすく直感的に使用できるものにするなど、UXデザインの合理化も行います。検索エンジンが効率的にコンテンツをクローリングしインデックス化できるように、サイトの構造を調整しましょう。
  • サイト内の価値が高い部分を優先する
    最も重要な部分をユーザーに見てもらえるように、サイト内の高品質なコンテンツ(エンゲージメント、信頼性、バックリンク、コンバージョン率が最も高いページ)で検索結果に重み付けしましょう。

検索関連性の課題と制限

検索結果の質の低さを改善するプロセスはもどかしいものであり、いつでも解決策がすぐにわかるとは限りません。意味が複数あるクエリの解釈には、必ず曖昧さがつきまとうものです。手間をかけずに真の意図を解読しようとすると、不備が生じます。真の意味で関連性のある検索結果は、最新のAIをもってしても解決できない認識に関する難問なのです。

検索エンジンを最新に保つには、言葉、専門用語、スラング、方言が多様性を増し変化している中で、世界中で休むことなく生成され続ける膨大なコンテンツに素早く適応させなければなりません。さらに、検索結果のパーソナライズは関連性の向上に大きな効果を発揮しますが、異なる視点に触れにくくなるフィルターバブルの原因にもなります。

ほとんどの組織にとって、検索関連性の最適化は不可解なものに思えるでしょう。ユーザーに関連性のある検索結果を提供できる時間はわずかであり、しかも絶えず減り続けているようです。


Elasticsearchでの検索関連性

Elasticsearch Relevance Engineは最先端の機械学習を備えており、関連性が高くパーソナライズされたAI駆動の検索エクスペリエンスを提供するためにまさしく必要なものを揃えられます。

また、わかりやすいドラッグアンドドロップ式の関連性調整ツールで分析、最適化、パーソナライズを行い、検索結果の精度を大きく高められます。順応型関連性を使用すれば、検索分析に基づいて自動的にデータドリブンな提案を表示し、最もパフォーマンスに優れる検索結果への注目度を高めることができます。さらに、生成AIベクトル検索、NLP変換器モデルのサポート、サードパーティモデル管理を活用して、セマンティックな関連付けも強化できます。


検索関連性のリソース


検索関連性に関するよくある質問

検索エンジンでは、どのようにして検索結果の関連性を決定しているのですか?

検索エンジンは、キーワードの一致やコンテンツの品質、ユーザーの意図、コンテクスト、意味、ユーザーの行動、エンゲージメントメトリックなどの情報を分析しソートする検索アルゴリズムに基づき、自然言語処理機械学習を利用して関連性を決定します。

検索関連性を調整するにはどうすればよいですか?

検索関連性の調整は、クエリレベルとインデックスレベルのいずれかで行えます。クエリ理解の包括性を高めると、より適切な検索結果が得られます。インデックスレベルでは、多くのデータセットでモデルをトレーニングすることで、検索関連性を調整できます。

検索関連性を高めるうえで、機械学習とAIはどのように役立ちますか?

機械学習AIを利用すると、ユーザーの意図をより正確に理解して、検索関連性を強化できます。これらはコンテクストと最近傍アルゴリズム(NNA)に基づき、埋め込みを利用してユーザーの意図を特定し、関連性の高い検索結果を取得します。ベクトル検索エンジンやセマンティック検索エンジンでは、複雑または曖昧な言葉やクエリを効果的に処理し、検索結果をパーソナライズするために機械学習とAIが活用されており、ハイブリッド検索エンジンでは両者を組み合わせることもあります。

パーソナライズは検索関連性にどのような効果がありますか?

パーソナライズとは、検索結果を各ユーザーの好み、行動、地理的所在地に合わせて調整することです。ユーザーの希望に即し、関連性があり有意義なコンテンツを提供できる確率を高められます。