Толковый словарь по нейросетям и искусственному интеллекту
Генерация с дополнением извлечения
Категория термина
Генерация с дополнением извлечения (RAG, Retrieval-Augmented Generation) — метод в области обработки естественного языка, при котором языковая модель дополняется внешним источником знаний. Вместо генерации ответа только на основе внутренних параметров, модель сначала извлекает релевантную информацию из базы данных или документов, а затем использует её для формирования более точного ответа.
🧠 Механизм работы
- Пользователь задаёт запрос (вопрос или задачу).
- Система выполняет поиск по внешнему источнику (база данных, документы, векторное хранилище).
- Извлекаются наиболее релевантные фрагменты информации.
- Эти данные передаются в языковую модель вместе с исходным запросом.
- Модель генерирует ответ с учётом найденного контекста.
🔑 Особенности
- Комбинирует поиск (retrieval) и генерацию (generation).
- Позволяет использовать актуальные и внешние данные.
- Снижает количество «галлюцинаций» модели.
- Не требует полного дообучения модели для обновления знаний.
📌 Примеры применения
- Чат-боты с доступом к внутренним базам знаний компании.
- Поисковые системы с генерацией ответов.
- AI-ассистенты, работающие с документацией и файлами.
⚖️ Преимущества и недостатки
Преимущества:
- Актуальность и точность ответов.
- Гибкость в обновлении данных.
- Снижение необходимости переобучения модели.
Недостатки:
- Зависимость от качества системы поиска.
- Увеличение сложности архитектуры.
- Дополнительные задержки при извлечении данных.
🧠 Связанные понятия
- LLM (Large Language Model) — большая языковая модель.
- Embedding — векторное представление данных.
- Vector Database — база данных для поиска по эмбеддингам.
- Prompt Engineering — настройка входных запросов.
- Fine-tuning — дообучение модели.
💡 Вывод
RAG является мощным подходом, объединяющим поиск и генерацию, позволяя значительно повысить точность и актуальность ответов языковых моделей. Он широко применяется в современных AI-системах, работающих с большими объёмами информации.
⚙️ Практическое применение
- Не используется напрямую в Automatic1111 или Kohya_SS, так как относится к NLP.
- Применяется в чат-ботах, AI-поиске и корпоративных системах знаний.
- Может использоваться вместе с LLaMA и другими LLM.
- Подходит для работы с большими документами и базами знаний.
- Требует настройки поиска (например, через embeddings и vector DB).