Толковый словарь по нейросетям и искусственному интеллекту
Размораживание текстового энкодера
Категория термина
Размораживание текстового энкодера (Text Encoder Unfreeze) — это режим обучения нейросетей, при котором текстовый энкодер (например, CLIP в Stable Diffusion) участвует в оптимизации, и его параметры обновляются вместе с другими частями модели. В отличие от заморозки, этот подход позволяет адаптировать энкодер к новым данным или специфическим задачам.
🧠 Механизм работы
- Текстовый энкодер преобразует промпт в вектор признаков.
- При unfreeze веса энкодера изменяются во время обучения, улучшая способность модели учитывать новые термины и описания.
- Обычно применяется при полном fine-tuning или в случаях, когда базовое понимание языка модели недостаточно.
🔑 Особенности
- Используется для более глубокой адаптации модели под нестандартные запросы.
- Требует значительно больше ресурсов по времени и памяти.
- Может сочетаться с выборочной заморозкой отдельных слоёв.
📌 Примеры применения
- Обучение модели на узкоспециализированном корпусе текстов (например, медицинские термины).
- Дообучение модели под редкие или неформальные выражения.
- Адаптация к другому языку или диалекту, слабо представленному в исходном датасете.
⚖️ Преимущества и недостатки
Преимущества:
- Повышает гибкость и адаптивность текстовой обработки.
- Улучшает понимание редких или новых терминов.
- Дает возможность обучать модель на более специализированных задачах.
Недостатки:
- Увеличивает время и стоимость обучения.
- Повышает риск катастрофического забывания уже выученных связей.
- Может привести к переобучению при небольшом датасете.
🧠 Связанные понятия
- Text Encoder Freeze — противоположный подход, при котором энкодер не обучается.
- Fine-tuning — дообучение модели на новых данных.
- Catastrophic Forgetting — потеря ранее изученных знаний при переобучении.
- Transfer Learning — перенос знаний между моделями.
- Regularization — методы стабилизации обучения и предотвращения переобучения.
💡 Вывод
Text Encoder Unfreeze делает процесс дообучения более гибким, позволяя модели лучше адаптироваться к новым терминам и задачам. Однако эта гибкость требует дополнительных ресурсов и может привести к потере стабильности, если не контролировать процесс обучения.