Geração aumentada de recuperação — um problema de busca

A busca é uma infraestrutura essencial para trabalhar com grandes modelos de linguagem (LLMs) e criar as melhores experiências de IA generativa. Você tem uma chance de pedir a um LLM para fornecer a resposta certa com seus dados, então a relevância é crucial. Fundamente seus LLMs com geração aumentada de recuperação (RAG) usando Elastic.

Video thumbnail

Experimente este aprendizado prático e em ritmo próprio para aprender a criar um aplicativo RAG.

Experimente a aprendizagem prática

Incorpore o RAG em seus apps e experimente diferentes LLMs com um banco de dados vetorial.

Saiba mais sobre o Elasticsearch Labs

Aprenda como criar aplicações avançadas baseadas em RAG usando o Elasticsearch Relevance Engine™.

Assista ao vídeo de início rápido

A vantagem da Elastic

Pronto para produção em escala empresarial

  • Acelerando as experiências de IA generativa

    Implemente suas experiências de IA generativa com rapidez e escala com o Elasticsearch.

  • O mecanismo de busca mais relevante para RAG

    Mantenha-se relevante com técnicas de busca de ponta (textual, semântica, vetorial, híbrida), ferramentas de reclassificação integradas e Learning to Rank (LTR).

  • Seleção de modelo facilitada

    Simplifique a seleção e o gerenciamento de modelos com nossa plataforma aberta para implementações RAG eficientes, eficazes e preparadas para o futuro.

CONFIADO PELA FORTUNE 500 PARA IMPULSIONAR A INOVAÇÃO EM IA GERATIVA

Prepare seus dados para o RAG

O RAG amplia o poder dos LLMs acessando dados proprietários relevantes sem necessidade de retreinamento. Ao usar RAG com a Elastic, você se beneficia de:

  • Técnicas de busca de última geração
  • Seleção fácil de modelos e capacidade de trocar modelos sem esforço
  • Acesso seguro a documentos e controle baseado em funções para garantir que seus dados permaneçam protegidos
Geração aumentada de recuperação (RAG) em ação

Transforme as experiências de busca

O que é a geração aumentada de recuperação (RAG)?

A geração aumentada de recuperação (RAG) é um padrão que aprimora a geração de texto integrando informações relevantes de fontes de dados proprietárias. Ao fornecer contexto específico do domínio ao modelo generativo, a RAG melhora a precisão e a relevância das respostas de texto geradas.

Utilize o Elasticsearch para janelas de contexto de alta relevância que utilizam seus dados proprietários para melhorar a saída do LLM e fornecer as informações em uma experiência conversacional segura e eficiente.

COMO A RAG FUNCIONA COM A ELASTIC

Aprimore seus fluxos de trabalho de RAG com o Elasticsearch

Descubra como o uso do Elastic para fluxos de trabalho de RAG aprimora as experiências de IA generativa. Sincronize facilmente com informações em tempo real usando fontes de dados proprietárias para obter as melhores e mais relevantes respostas de IA generativa.

O pipeline de inferência de machine learning utiliza processadores de ingest do Elasticsearch para extrair embeddings de forma eficiente. Combinando de forma integrada buscas de texto (correspondência BM25) e vetoriais (kNN), ele recupera documentos com as melhores pontuações para a geração de respostas contextualizadas.

CASO DE USO

Serviço de perguntas e respostas que opera no seu conjunto de dados privado

Implemente experiências de perguntas e respostas usando RAG, desenvolvido pelo Elasticsearch como um banco de dados vetorial.

O Elasticsearch é o banco de dados vetorial mais amplamente implantado

Copie para testar localmente em dois minutos

```
curl -fsSL https://elastic.co/pt/start-local
``` | sh
Leia os documentos
OU

IA Search — em ação

  • Cliente em destaque

    A Consensus atualiza a plataforma de pesquisa acadêmica com busca semântica avançada e ferramentas de IA da Elastic.

  • Cliente em destaque

    A Cisco cria experiências de busca baseadas em IA com a Elastic no Google Cloud.

  • Cliente em destaque

    A Georgia State University aumenta os insights de dados e explora maneiras de ajudar os alunos a solicitar auxílio financeiro com busca baseada em IA.

Perguntas frequentes

O que é RAG em IA?

A geração aumentada de recuperação (comumente chamada de RAG) é um padrão de processamento de linguagem natural que permite que as empresas pesquisem fontes de dados proprietárias e forneçam contexto que fundamenta grandes modelos de linguagem. Isso possibilita respostas mais precisas e em tempo real em aplicações de IA generativa.