Толковый словарь по нейросетям и искусственному интеллекту
Механизм внимания
Attention
Категория термина
Механизм внимания (attention) — это архитектурный компонент нейронных сетей, который позволяет модели фокусироваться на наиболее значимых частях входных данных при выполнении конкретной задачи. В отличие от классических моделей, где весь вход обрабатывается одинаково, attention динамически определяет, какие части входа более важны в текущем контексте и выделяет им больше «внимания» при генерации выхода.Изначально механизм внимания был предложен в 2014 году для задач машинного перевода, где он позволял модели при генерации каждого слова в переводе уделять внимание разным словам во входном предложении. Эта идея оказалась настолько мощной, что легла в основу современных архитектур, таких как Transformer, BERT, GPT и других.Типы attention:
- Bahdanau Attention (Additive Attention): первая реализация в RNN-сетях для машинного перевода.
- Luong Attention (Multiplicative Attention): оптимизированный вариант с матричным умножением.
- Self-Attention (само-внимание): позволяет модели оценивать важность всех частей входной последовательности по отношению друг к другу — ключевой элемент трансформеров.
- Multi-Head Attention: параллельное применение нескольких механизмов внимания, что позволяет захватывать различные аспекты взаимосвязей.
- Машинный перевод (MT)
- Генерация текста (NLP)
- Вопросно-ответные системы
- Резюмирование текстов
- Обработка изображений (например, визуальное внимание в CNN)
- Мультимодальные модели (объединение текста, изображения и аудио)