Глоссарий AI терминов
RAG
Retrieval-Augmented Generation
RAG — это метод, объединяющий два этапа: поиск информации из внешних источников и генерацию текста с помощью языковой модели (LLM). Такой подход позволяет снизить риск «галлюцинаций» и повысить точность ответов за счет использования актуальных или специализированных данных.
Компоненты RAG-системы:
- Retriever — алгоритм поиска (например, на основе эмбеддингов), который выбирает релевантные фрагменты из базы знаний.
- Generator — языковая модель (LLM), которая генерирует ответ, опираясь на найденные данные.
- Знаниевая база — внешние источники (документы, статьи, базы данных), откуда извлекается информация.
Преимущества RAG:
- Ответы основаны на проверенных данных, а не только на предобученных знаниях LLM.
- Возможность работать с актуальной или узкоспециализированной информацией.
- Снижение риска дезинформации и этических проблем.
Применение: чат-боты с доступом к документам, техническая поддержка, медицинские консультации, аналитика с использованием корпоративных данных.
Примеры: системы на платформах Haystack, LangChain, кастомизированные RAG-решения для бизнеса.
Сложности:
- Зависимость от качества и структуры базы знаний.
- Высокие требования к вычислительным ресурсам для поиска и генерации.