Толковый словарь по нейросетям и искусственному интеллекту
Резидуальное соединение
Residual Connection
Остаточное соединение
Категория термина
Residual Connection (Резидуальное соединение, остаточное соединение) — это архитектурный приём в нейронных сетях, при котором выход слоя или блока передаётся не только в следующий слой, но и напрямую добавляется к его входу. Такой подход был впервые предложен в архитектуре ResNet и значительно улучшил процесс обучения глубоких сетей, устранив проблему исчезающего и взрывающегося градиента.
🧠 Механизм работы:
- В стандартной сети каждый слой напрямую преобразует вход xx в выход F(x)F(x).
- В residual-соединении выход вычисляется как:y=F(x)+xy = F(x) + xгде F(x)F(x) — преобразование слоя (например, свёртка + активация), а xx — shortcut-соединение (прямой путь).
- Такое сложение позволяет градиентам легче проходить сквозь глубокую сеть, упрощая оптимизацию.
- Если обучение не требует сложных преобразований, слой может просто вернуть тождественное отображение, а shortcut сохранит входные данные.
🔑 Основные особенности:
- Устраняет проблему исчезающего градиента в глубоких сетях.
- Позволяет строить сверхглубокие архитектуры (сотни и тысячи слоёв).
- Shortcut-соединение не добавляет дополнительных параметров (если используется простое сложение).
- Может быть реализовано как identity connection (простое сложение) или с дополнительным линейным преобразованием (например, W⋅xW \cdot x).
📌 Примеры применения:
- ResNet — первая архитектура, где этот подход сделал возможным обучение сетей глубиной > 100 слоёв.
- Transformers — residual connection используется внутри блоков внимания и feed-forward слоёв.
- GANs — улучшает устойчивость генераторов и дискриминаторов.
- Speech Recognition — упрощает обучение глубоких рекуррентных и сверточных моделей.
⚖️ Преимущества и недостатки:
Преимущества:
- Ускоряет и стабилизирует обучение.
- Позволяет строить значительно более глубокие сети.
- Снижает риск деградации точности при увеличении глубины.
Недостатки:
- Shortcut может "маскировать" неэффективное обучение промежуточных слоёв.
- Усложняет интерпретацию роли каждого слоя.
- Иногда приводит к избыточным параметрам, если используется learnable projection.
🧠 Связанные понятия:
- ResNet — архитектура, где residual connection стал базовым элементом.
- Highway Networks — предшественник residual-сетей, где использовались управляющие гейты.
- DenseNet — альтернативный метод с плотными соединениями.
- Skip Connection — более общий термин, охватывающий residual connection.