Толковый словарь по нейросетям и искусственному интеллекту
Пошаговое рассуждение в подсказке
Категория термина
Пошаговое рассуждение в подсказке (Chain-of-Thought Prompting, CoT) — это техника работы с большими языковыми моделями (LLM), при которой модель стимулируется явно показывать последовательность промежуточных рассуждений, ведущих к финальному ответу. Вместо прямого ответа модель "рассуждает вслух", разбивая задачу на шаги.
🧠 Механизм работы
- Пользователь формулирует задачу и добавляет в промпт указание:
«Объясни свои шаги рассуждения», «Подумай шаг за шагом». - Модель сначала генерирует цепочку мыслей (логический путь).
- На основе этой цепочки формируется конечный ответ.
🔑 Особенности
- Улучшает точность при решении задач, требующих логики или арифметики.
- Основан на in-context learning, где примеры пошаговых решений включаются прямо в промпт.
- Может использоваться с методами:
- Few-Shot Chain-of-Thought — когда в контексте показаны решения-примеры.
- Zero-Shot CoT — когда используется универсальная фраза «Подумаем шаг за шагом».
📌 Примеры применения
- Математика
Вопрос: У Анны было 3 яблока, она купила ещё 5. Сколько всего яблок у Анны? Решение: У Анны было 3 яблока. Она купила 5. 3 + 5 = 8. Ответ: 8 - Логические задачи
Вопрос: В поезде 10 вагонов. В каждом вагоне по 20 пассажиров. Сколько всего пассажиров? Рассуждение: Всего 10 вагонов × 20 пассажиров = 200. Ответ: 200 - Классификация текста
Текст: "Этот фильм был невероятно скучным." Рассуждение: Слово "скучным" указывает на негативное восприятие. Ответ: Негативный
⚖️ Преимущества и недостатки
Преимущества:
- Повышает интерпретируемость ответов.
- Существенно улучшает результаты в сложных задачах (арифметика, логика, программирование).
- Может использоваться как инструмент проверки корректности шага за шагом.
Недостатки:
- Увеличивает длину ответов (и затраты на вычисления).
- Иногда приводит к «галлюцинациям в рассуждениях».
- При неправильных промежуточных шагах финальный ответ также будет ошибочным.
🧠 Связанные понятия
- In-Context Learning — CoT является его расширением.
- Few-Shot Prompting — добавление примеров пошаговых решений в контекст.
- Zero-Shot Prompting — CoT может работать даже без примеров, только с инструкцией.
- Self-Consistency — техника, где модель генерирует несколько цепочек рассуждений, а финальный ответ выбирается голосованием.
💡 Вывод
Chain-of-Thought Prompting — это метод, при котором языковая модель решает задачи, раскрывая промежуточные шаги рассуждения. Такой подход повышает точность и объяснимость работы модели, особенно в задачах, требующих логики и многозвенности.