logo

Intégration de la recherche basée sur l'IA dans vos applications

Elasticsearch Relevance Engine™ (ESRE) est conçu pour propulser des applications de recherche fondées sur l'intelligence artificielle. ESRE permet d'appliquer immédiatement une recherche sémantique avec un niveau de pertinence supérieur (sans adaptation de domaine), d'effectuer une intégration à de grands modèles de langage externes, d'implémenter une recherche hybride et d'utiliser des modèles de transformateur tiers ou les vôtres.

Video thumbnail

Pour configurer Elasticsearch Relevance Engine, c'est très simple. On vous montre comment faire.

Regarder la vidéo de prise en main rapide

Concevez des applications avancées basées sur la RAG à l'aide d'ESRE.

S'inscrire à la formation

Utilisez les données internes privées pour donner du contexte aux fonctionnalités des modèles d'IA générative afin de fournir des réponses fiables et à jour aux questions des utilisateurs.

Regarder la vidéo

IA pour l'ensemble des développeurs

Amélioration de la recherche à l'aide de l'intelligence artificielle

Intégrez des fonctionnalités de pertinence avancées et fondées sur l'intelligence artificielle à votre application grâce à ESRE, indépendamment de votre niveau d'expertise. ESRE est doté d'un éventail de fonctionnalités qui vous aide à vous lancer avec l'intelligence artificielle et à développer votre expérience en la matière. Vous bénéficiez de la flexibilité et du contrôle nécessaires pour déployer des applications de recherche propulsées par l'intelligence artificielle générative et de Machine Learning qui répondent à vos besoins.

  • Vous êtes novice en recherche sémantique ?

    L'ajout de la recherche sémantique à votre application ne devrait pas nécessiter un niveau élevé d'expertise. Bénéficiez de la meilleure recherche sémantique immédiatement exploitable grâce au modèle Elastic Learned Sparse Encoder. À l'aide d'un déploiement simplifié, fournissez rapidement la recherche sémantique sans devoir suivre une formation complexe ni assurer la maintenance d'un modèle de Machine Learning.

  • Vous connaissez bien les vecteurs de recherche et les plongements ?

    Convertissez vos données non structurées en plongements vectoriels et effectuez des recherches efficaces à l'aide du plus proche voisin approximatif. Associez vos propres données spécifiques à un domaine dans des fenêtres de contexte afin d'améliorer la pertinence des résultats d'apparence humaine des grands modèles de langage.

  • Utilisation de vos propres modèles de transformateur

    Utilisez la bibliothèque Eland de Python pour exploiter votre propre modèle de Machine Learning entraîné ou choisissez un modèle tiers dans un référentiel public, comme HuggingFace. Vous avez à votre disposition un vaste éventail d'architectures prises en charge qui répondent à vos besoins.

Elasticsearch Relevance Engine

Elasticsearch - un poids lourd de la recherche vectorielle centralisée

Générez des plongements. Stockez des vecteurs, recherchez-les et gérez-les. Bénéficiez de la recherche sémantique grâce au propre modèle de Machine Learning Learned Sparse Encoder d'Elastic. Ingérez tous types de données. Intégrez-les à l'aide de grands modèles de langage à l'évolution rapide.

  • Classement hybride avec la RRF

    La fusion des rangs réciproques (RRF ou "Reciprocal Rank Fusion") est une méthode d'association des classements de documents provenant de plusieurs systèmes de récupération. Dans l'avenir proche, la RRF prendra en charge la combinaison des résultats provenant de modèles de vecteurs épars, comme BM25, et du modèle de récupération d'Elastic, ce qui génère la meilleure méthode de classement "zero-shot". Grâce au classement hybride avec la RRF, affinez plus facilement les résultats de recherche provenant de plusieurs systèmes de récupération.

  • Elastic Learned Sparse Encoder

    Notre nouveau modèle fournit une recherche sémantique hautement pertinente et prête à l'emploi qui ne nécessite aucune adaptation de domaine. Ce modèle est disponible en un seul clic lors de la configuration de votre application de recherche. Elastic Learned Sparse Encoder élargit les requêtes à l'aide de scores de pertinence et de mots-clés connexes, afin qu'elles soient faciles à interpréter et prêtes à être utilisées instantanément.

  • Génération augmentée de récupération

    Ingérez des informations métier spécifiques dans les grands modèles de langage à l'aide de vos données privées (et pas seulement de données publiques entraînées). Utilisez Elasticsearch pour bénéficier de fenêtres de contexte hautement pertinentes qui exploitent vos données propriétaires afin d'améliorer la pertinence et les résultats des grands modèles de langage. Accédez à l'IA générative avec des API et des plug-ins intégrés au grand modèle de langage de votre choix.

  • Base de données vectorielle

    Bénéficiez d'une expérience de recherche vectorielle complète à grande échelle. Ne vous contentez pas de stocker les plongements et d'y mener des recherches. Créez-les ! Capturez la signification et le contexte de vos données non structurées, y compris les textes et les images, à l'aide de plongements pour la récupération complexe. Sécurisez vos plongements au niveau du document afin de vous assurer que les données sont entre de bonnes mains.

  • Utilisation de vos propres modèles de transformateur

    Intégrez votre propre modèle de transformateur propriétaire dans Elastic. Vous pouvez également charger des modèles préentraînés provenant de référentiels tiers, comme le hub de HuggingFace. Vous bénéficiez ainsi d'un éventail d'architectures prises en charge, notamment BERT, BART et ELECTRA.

  • Bibliothèques d'ingestion et intégrations des données

    Bénéficiez des outils dont vous avez l'habitude, comme Elastic Agent ou Logstash, pour indexer vos données, d'une liste en constante évolution d'intégrations (par exemple, Confluence, S3 ou Google Drive), de connecteurs de base de données natifs (notamment MySQL et MongoDB) et d'un robot d'indexation pour les sources en ligne. Pour les données des applications personnalisées, utilisez les API de Kibana ou votre propre connecteur personnalisé dans des frameworks familiers.

Chris Brown, Chief Product Officer, Relativity

"Je suis ravi de pouvoir apporter de tels avantages à notre clientèle grâce à nos investissements nous permettant d'exploiter Elasticsearch dans RelativityOne. Nous testons ESRE actuellement et sommes enthousiasmés par sa capacité à fournir à notre clientèle des résultats de recherche performants et renforcés par l'intelligence artificielle."

Chris BrownDirecteur des produits chez Relativity

Questions fréquentes

Qu'est-ce qu'Elasticsearch Relevance Engine ?

Elasticsearch Relevance Engine est un ensemble de fonctionnalités qui aident les développeurs à concevoir des applications de recherche propulsées par l'IA. Il comprend notamment :

  • des fonctionnalités avancées et de pointe de classement par pertinence, y compris la recherche traditionnelle par mot-clé avec BM25, sur lesquelles se fonde la recherche hybride pertinente pour l'ensemble des domaines ;
  • les fonctionnalités complètes de la base de données vectorielle, y compris la capacité à créer des plongements, en plus du stockage et de la récupération des vecteurs ;
  • Elastic Learned Sparse Encoder, notre nouveau modèle de Machine Learning pour la recherche sémantique dans un éventail de domaines ; le classement hybride (RRF) pour l'association des fonctionnalités de recherche vectorielle et textuelle afin de garantir une pertinence optimale dans un vaste éventail de domaines ;
  • la prise en charge de l'intégration à des modèles tiers de transformateur, comme OpenAI GPT-3 et 4 via des API ;
  • une suite complète d'outils d'ingestion des données, comme des connecteurs de base de données, des intégrations de données tierces, des robots d'indexation et des API, qui permet de créer des connecteurs personnalisés ;
  • des outils de développement permettant de concevoir des applications de recherche pour tous les types de données, notamment textuelles, images, temporelles, géographiques et multimédias.