Qu'est-ce que la recherche sémantique ?
Déterminez quel type de mise en œuvre vous convient le mieux : une mise en œuvre prête à l'emploi ou une mise en œuvre personnalisée ?
Définition de la recherche sémantique
La recherche sémantique est une technologie de moteur de recherche qui interprète le sens des mots et des phrases. Elle renvoie des contenus qui correspondent au sens d'une requête, et non pas des contenus qui collent littéralement aux mots d'une requête.
La recherche sémantique regroupe les capacités d'un moteur de recherche, parmi lesquelles la compréhension des mots par rapport à l'intention de l'utilisateur et au contexte de la recherche.
Ce type de recherche vise à améliorer la qualité des résultats renvoyés grâce à une interprétation plus précise et en contexte du langage naturel. Pour y parvenir, la recherche sémantique fait correspondre l'intention de la recherche et le sens sémantique en s'appuyant sur des technologies telles que le Machine Learning et l'intelligence artificielle.
Comment la recherche sémantique fonctionne-t-elle ?
La recherche sémantique est adossée à la recherche vectorielle, qui lui permet de fournir et de classer les contenus en fonction de la pertinence contextuelle et de la pertinence de l'intention. La recherche vectorielle encode les détails des informations recherchables dans les champs de termes ou articles associés, qu'on appelle vecteurs, puis compare ces vecteurs pour déterminer ceux qui présentent la plus grande similarité.
Une recherche sémantique adossée à une recherche vectorielle produit des résultats en travaillant simultanément des deux côtés du pipeline de la requête. Au moment où une requête est lancée, le moteur de recherche transforme celle-ci en plongements, qui sont des représentations numériques des données et du contexte associé. Ces représentations sont stockées sous forme de vecteurs. L'algorithme kNN, c'est-à-dire l'algorithme des k plus proches voisins, fait alors correspondre les vecteurs des documents existants aux vecteurs de la requête (à noter : une recherche sémantique concerne du texte). La recherche sémantique génère ensuite des résultats et les classe en fonction de leur pertinence conceptuelle.
- Au moment où une requête est lancée, le moteur de recherche transforme celle-ci en plongements, qui sont des représentations numériques des données et du contexte associé. Ces représentations sont stockées sous forme de vecteurs.
- L'algorithme kNN, c'est-à-dire l'algorithme des k plus proches voisins, fait alors correspondre les vecteurs des documents existants aux vecteurs de la requête (à noter : une recherche sémantique concerne du texte).
- La recherche sémantique génère ensuite des résultats et les classe en fonction de leur pertinence conceptuelle.
Contexte
Dans le cadre d'une recherche sémantique, le contexte peut faire référence à toute information supplémentaire, comme la localisation géographique de la personne qui fait la recherche, le contexte textuel des mots employés dans la requête, ou encore le contexte de l'historique de recherche de l'utilisateur.
La recherche s'appuie sur les indications contextuelles pour déterminer le sens d'un mot dans un ensemble comptant des millions d'exemples. La recherche sémantique identifie également les autres mots qui peuvent être utilisés dans des contextes similaires.
Par exemple, une recherche sur le terme "football" signifierait "soccer" aux États-Unis et "football" au Royaume-Uni et dans d'autres régions du monde. La recherche sémantique ferait donc une distinction dans les résultats selon la localisation géographique de l'utilisateur.
Intention de l'utilisateur
Le rôle de la recherche sémantique est d'améliorer l'expérience de l'utilisateur. Pour fournir les résultats les plus pertinents, elle interprète l'intention de l'utilisateur pour comprendre ses besoins. Veut-il obtenir des informations ? Cherche-t-il à faire un achat ? Selon la requête et le contexte dans lequel elle s'inscrit, la recherche sémantique va classer les résultats par ordre de pertinence.
La recherche sémantique peut être également modifiée ou optimisée à l'aide d'un paramétrage de catégorisation des requêtes, pour afficher par exemple les produits les mieux notés en premier jusqu'aux produits les moins bien notés.
Article connexe : Elastic Enterprise Search : effectuez des recherches dans les systèmes et logiciels d'entreprise
Recherche sémantique et recherche par mots-clés
La différence entre la recherche sémantique et la recherche par mots-clés est la suivante : la recherche par mots-clés renvoie des résultats qui correspondent aux termes exacts, à des synonymes ou à des mots similaires, tandis que la recherche sémantique s'intéresse au sens des mots de la requête. Dans certains cas, la recherche sémantique peut générer des résultats qui n'auront pas de correspondance directe avec les mots employés, mais qui se conformeront à l'intention de l'utilisateur.
Les moteurs de recherche par mots-clés utilisent des outils d'expansion ou de relaxation des requêtes, comme les synonymes ou les omissions de mots. Ils utilisent également des outils de traitement du langage naturel et de compréhension, comme la tolérance aux fautes d'orthographe, la conversion en tokens et la normalisation. En revanche, la recherche sémantique peut renvoyer des résultats de requête qui correspondent au sens avec l'utilisation de la recherche vectorielle.
Prenons l'exemple de "lait au chocolat". Un moteur de recherche sémantique fera la distinction entre un "lait au chocolat" et du "chocolat au lait". Même si les mots-clés de la requête sont identiques, l'ordre dans lequel ils sont indiqués a une incidence sur le sens. En tant qu'humains, nous comprenons que "chocolat au lait" fait référence à un type de chocolat, tandis que "lait au chocolat" est une boisson lactée goût chocolat.
Allez au-delà des expériences de recherche traditionnelles. Lisez notre article et découvrez les meilleures approches pour mettre en place la recherche sémantique dans vos applications.
En quoi la recherche sémantique est-elle importante ?
La recherche sémantique est importante car elle offre une surface de recherche plus vaste. Étant donné qu'elle est adossée à la recherche vectorielle, elle permet une expérience de recherche plus intuitive, dans laquelle le contexte et l'intention sont essentiels pour générer des résultats.
Étant donné que les algorithmes de recherche sémantique continuent à "apprendre" à l'aide de nombreux indicateurs clés de performance (KPI), comme les taux de conversion et les taux de rebond, la recherche sémantique contribue à booster la satisfaction des utilisateurs.
Découvrez les grandes tendances en matière de recherche technique pour 2024. Regardez ce webinar pour vous familiariser avec les bonnes pratiques et les méthodologies émergentes, ainsi que pour découvrir les grandes tendances incontournables pour les développeurs en 2024.
Exemples de recherche sémantique
La recherche sémantique produit des résultats qui se basent sur la localisation géographique de l'utilisateur, l'historique de ses précédentes recherches et son intention.
La personnalisation s'appuie sur les recherches et les interactions précédentes de l'utilisateur pour déterminer la pertinence et le classement de la réponse. La recherche sémantique peut également remanier le classement des résultats selon la façon dont les autres utilisateurs ont interagi avec les réponses qu'elle a formulées. Par exemple, lorsque vous entrez "restaurants" dans votre moteur de recherche, celui-ci affichera des résultats aux alentours de l'endroit où vous vous trouvez.
En ayant une meilleure compréhension de l'intention de l'utilisateur, la recherche sémantique peut répondre à une requête du type : "comparaison cocottes Creuset Staub", et renvoyer du contenu axé principalement sur les comparatifs entre ces deux marques, pour respecter l'intention de l'utilisateur. La recherche sémantique sera capable de reconnaître l'intention qui se cache derrière les requêtes du type "meilleures offres Staub" ou "remises Creuset", à savoir l'intention d'achat, et proposera des réponses en conséquence.
Autre exemple : le texte prédictif. Au fur et à mesure que vous tapez votre requête dans la barre de recherche, celle-ci utilise la recherche sémantique pour compléter votre requête et suggérer des termes de recherche appropriés selon le contexte, les recherches courantes et l'historique des recherches précédentes.
Avantages de la recherche sémantique
La recherche sémantique est avantageuse pour les entreprises et leurs clients car elle améliore l'expérience de recherche.
Facilité d'utilisation pour les clients
Les clients peuvent avoir oublié un terme spécifique ou un nom de produit. La recherche sémantique leur permet de formuler une requête vague et d'obtenir des résultats précis. Les clients peuvent aussi faire une recherche à l'aide d'une description pour découvrir le terme qui lui est associé. Par exemple, vous pouvez faire une recherche sur les paroles d'une chanson pour en découvrir le titre.
Étant donné que la recherche sémantique interprète le sens en prenant en compte l'intention et le contexte, l'expérience côté client ressemble davantage à une interaction humaine.
Plus grande robustesse des concepts par rapport aux mots-clés
En établissant une correspondance avec des concepts plutôt qu'avec des mots-clés, la recherche sémantique produit des résultats plus précis. Par l'intermédiaire des plongements dimensionnels, un vecteur représente un mot sous forme de concept. Le mot "voiture" ne correspond plus uniquement à "voiture" ou "voitures", il peut être également associé aux termes "conducteur", "assurance", "pneus", "électrique", "hybride", etc. car ces termes sont reliés au vecteur "voiture".
De ce fait, la recherche sémantique va plus loin qu'une simple mise en correspondance de mots-clés représentés par des tokens, car elle est adossée à la recherche vectorielle.
Une fonctionnalité précieuse pour les entreprises
En comprenant l'intention de l'utilisateur, la recherche sémantique peut booster les ventes et la satisfaction client. L'intention de l'utilisateur peut être informationnelle, transactionnelle, navigationnelle ou commerciale. En déterminant cette intention, un moteur de recherche peut mieux répondre aux besoins du client. Ainsi, la relation entre le client et une marque s'en retrouve renforcée, ce qui est bénéfique pour l'entreprise.
La recherche sémantique avec Elasticsearch
La plateforme Elasticsearch est équipée de solutions de Machine Learning et d'IA, dont un modèle de recherche sémantique : Elastic Learned Sparse EncodeR, ou ELSER. Ce modèle NLP est entraîné par Elastic afin de proposer la recherche sémantique dans un outil facile à déployer.
Regardez cette vidéo pour en savoir plus sur le modèle d'encodeur zero-shot d'Elastic, son fonctionnement et l'aide qu'il peut vous apporter pour mettre rapidement en place la recherche sémantique pour les applications de recherche adossées à l'IA et les expériences d'IA générative. Le modèle de Machine Learning d'Elastic ne nécessite aucun entraînement, ce qui vous permet d'économiser du temps et de l'argent.
Plus de ressources sur la recherche sémantique
- Recherche sémantique : comment apporter des expériences de recherche à l'heure de l'intelligence artificielle
- Understanding AI search algorithms
- Présentation des modèles NLP et de la recherche vectorielle : Partie I
- 5 raisons pour lesquelles les responsables informatiques ont besoin de la recherche vectorielle pour améliorer les expériences de recherche
- Vidéo : Vector search with Elastic
- Add NLP inference to ingest pipelines
- k-nearest neighbor (kNN) search
Prochaines étapes conseillées
Pour aller plus loin, voici quatre méthodes qui vous aideront à révéler des informations exploitables à partir des données de votre entreprise :
- Démarrez un essai gratuit et découvrez l'aide qu'Elastic peut apporter à votre entreprise.
- Faites le tour de nos solutions afin de savoir comment Elasticsearch Platform fonctionne et comment elles s'adaptent à vos besoins.
- Découvrez comment mettre en place l'IA générative dans votre entreprise.
- Partagez cet article avec une personne de votre réseau qui pourrait être intéressée par son contenu. Partagez cet article par e-mail, sur LinkedIn, sur Twitter ou sur Facebook.