Толковый словарь по нейросетям и искусственному интеллекту
Заморозка слоёв
Layer Freezing
Категория термина
Заморозка слоёв (Layer Freezing) — это техника в обучении нейронных сетей, при которой веса некоторых слоёв модели фиксируются и не обновляются во время тренировки. Такой подход часто используется в трансферном обучении (transfer learning), когда предобученная модель дообучается на новых данных. Обычно замораживаются ранние слои, отвечающие за извлечение базовых признаков, а последние слои остаются обучаемыми, чтобы адаптироваться под конкретную задачу.
🧠 Механизм работы:
- Берётся предобученная модель (например, ResNet, BERT, ViT).
- Определяются слои, которые будут «заморожены» (градиенты для них не считаются).
- Во время обратного распространения (backpropagation) параметры этих слоёв не обновляются.
- Оставшиеся слои дообучаются на новых данных, адаптируя модель к задаче.
🔑 Основные подходы:
- Полная заморозка
- Все слои фиксируются, обучается только новый классификатор.
- Частичная заморозка
- Фиксируются ранние слои, а последние слои модели остаются обучаемыми.
- Постепенная разморозка (gradual unfreezing)
- Сначала обучается верхняя часть модели, затем поэтапно размораживаются нижние слои.
📌 Примеры применения:
- Компьютерное зрение
- В CNN (например, VGG, ResNet) замораживаются первые слои, извлекающие низкоуровневые признаки (линии, текстуры).
- Обработка текста
- В BERT или GPT фиксируются нижние слои, а верхние подстраиваются под задачу классификации, NER или анализа тональности.
- Speech Recognition
- В моделях ASR замораживаются слои акустических признаков, а обучаются языковые компоненты.
⚖️ Преимущества и недостатки:
Преимущества:- Сокращает время обучения и требования к ресурсам.
- Снижает риск переобучения при малом количестве данных.
- Использует преимущества предобученных универсальных признаков.
- Снижает гибкость модели — замороженные слои не адаптируются к новой задаче.
- Может ограничить качество на специфичных данных.
- Нужен баланс: слишком сильная заморозка может ухудшить результат.
🧠 Связанные понятия:
- Transfer Learning — общий подход, где чаще всего применяется заморозка слоёв.
- Fine-tuning — настройка всей модели, противоположный подход полной заморозке.
- Gradual Unfreezing — поэтапная разморозка слоёв для лучшей адаптации.
- Feature Extraction — использование замороженной модели как экстрактора признаков.