Толковый словарь по нейросетям и искусственному интеллекту

Генерация с дополнением извлечения

Retrieval-Augmented Generation
RAG

Категория термина


Генерация с дополнением извлечения (RAG, Retrieval-Augmented Generation) — метод в области обработки естественного языка, при котором языковая модель дополняется внешним источником знаний. Вместо генерации ответа только на основе внутренних параметров, модель сначала извлекает релевантную информацию из базы данных или документов, а затем использует её для формирования более точного ответа.

🧠 Механизм работы

  1. Пользователь задаёт запрос (вопрос или задачу).
  2. Система выполняет поиск по внешнему источнику (база данных, документы, векторное хранилище).
  3. Извлекаются наиболее релевантные фрагменты информации.
  4. Эти данные передаются в языковую модель вместе с исходным запросом.
  5. Модель генерирует ответ с учётом найденного контекста.

🔑 Особенности

  • Комбинирует поиск (retrieval) и генерацию (generation).
  • Позволяет использовать актуальные и внешние данные.
  • Снижает количество «галлюцинаций» модели.
  • Не требует полного дообучения модели для обновления знаний.

📌 Примеры применения

  • Чат-боты с доступом к внутренним базам знаний компании.
  • Поисковые системы с генерацией ответов.
  • AI-ассистенты, работающие с документацией и файлами.

⚖️ Преимущества и недостатки

Преимущества:

  • Актуальность и точность ответов.
  • Гибкость в обновлении данных.
  • Снижение необходимости переобучения модели.

Недостатки:

  • Зависимость от качества системы поиска.
  • Увеличение сложности архитектуры.
  • Дополнительные задержки при извлечении данных.

🧠 Связанные понятия

  • LLM (Large Language Model) — большая языковая модель.
  • Embedding — векторное представление данных.
  • Vector Database — база данных для поиска по эмбеддингам.
  • Prompt Engineering — настройка входных запросов.
  • Fine-tuning — дообучение модели.

💡 Вывод

RAG является мощным подходом, объединяющим поиск и генерацию, позволяя значительно повысить точность и актуальность ответов языковых моделей. Он широко применяется в современных AI-системах, работающих с большими объёмами информации.

⚙️ Практическое применение

  • Не используется напрямую в Automatic1111 или Kohya_SS, так как относится к NLP.
  • Применяется в чат-ботах, AI-поиске и корпоративных системах знаний.
  • Может использоваться вместе с LLaMA и другими LLM.
  • Подходит для работы с большими документами и базами знаний.
  • Требует настройки поиска (например, через embeddings и vector DB).

🤔 Остались вопросы? Спросите ИИ

Используйте в запросе не более 500 символов.

📌 Последние запросы

  • Нарисуй мне игральную карту как из игры Hearthstone. На ней должен быть изображён молодой парень в о… 1 неделя назад
  • Как выбрать размер сглаживания? 2 недели назад
  • Сможешь поределить значение подписи 2 недели назад

📥 Скачать список терминов (646)

Форматы: TXT (список) | CSV (Excel) | JSON (код) | XML (данные) | MD (Markdown)