Толковый словарь по нейросетям и искусственному интеллекту

Сглаживание меток

Label Smoothing

Категория термина


Сглаживание меток (Label Smoothing) — это техника регуляризации, используемая в обучении нейросетей для классификации, при которой «жесткие» истинные метки (one-hot) заменяются на слегка «размытую» версию. Вместо того чтобы модель училась полностью доверять одной правильной категории, ей предлагается распределение вероятностей, где правильный класс имеет вероятность чуть меньше 1, а остальные классы — небольшую ненулевую вероятность. Это снижает переобучение и делает модель более устойчивой.

🧠 Механизм работы:

  • Для задачи с KK классами исходная one-hot метка yy преобразуется:
yLS=(1−ϵ)⋅y+ϵKy^{LS} = (1 - epsilon) cdot y + frac{epsilon}{K}

где ϵepsilon — коэффициент сглаживания (обычно 0.05–0.1).

  • После этого используется стандартная функция потерь, например, Categorical Cross-Entropy с новыми «сглаженными» метками.

🔑 Основные особенности:

  • Уменьшает уверенность модели в своих предсказаниях.
  • Помогает избежать переобучения на ограниченных или шумных данных.
  • Легко интегрируется в существующие классификационные модели.
  • Часто применяется совместно с Softmax на выходном слое.

📌 Примеры применения:

  • Обучение больших трансформеров (BERT, GPT, Vision Transformers) — повышает обобщающую способность модели.
  • Классификация изображений (ImageNet, CIFAR-10) — снижает переобучение на конкретные метки.
  • NLP-задачимашинный перевод, языковое моделирование.
  • Обучение с учителем (Knowledge Distillation) — сглаженные метки служат «мягкими целями» для студент-модели.

⚖️ Преимущества и недостатки:

Преимущества:

  • Повышает обобщающую способность модели.
  • Уменьшает риск переобучения и чрезмерной уверенности предсказаний.
  • Простая реализация без изменения архитектуры.

Недостатки:

  • Слишком большое значение ϵepsilon может снизить точность модели.
  • Не решает всех проблем переобучения; используется как дополнение к другим методам регуляризации.
  • Может слегка «размывать» интерпретацию вероятностей для критически важных приложений.

🧠 Связанные понятия:

  • Softmax — слой, с которым обычно применяется label smoothing.
  • Cross-Entropy Lossфункция потерь, используемая вместе с размазанными метками.
  • Knowledge Distillation — использование мягких меток для обучения студент-моделей.
  • Regularization — общая категория техник, к которой относится label smoothing.

💡 Вывод:

Сглаживание меток (Label Smoothing) — это эффективная техника регуляризации для классификационных моделей, позволяющая сделать их более устойчивыми и обобщающими. Она предотвращает чрезмерную уверенность модели в своих предсказаниях и широко применяется в современных глубоких архитектурах, включая трансформеры и сверточные сети.

🤔 Остались вопросы? Спросите ИИ

Используйте в запросе не более 500 символов.

📌 Последние запросы

  • Нарисуй мне игральную карту как из игры Hearthstone. На ней должен быть изображён молодой парень в о… 1 неделя назад
  • Как выбрать размер сглаживания? 2 недели назад
  • Сможешь поределить значение подписи 2 недели назад

📥 Скачать список терминов (646)

Форматы: TXT (список) | CSV (Excel) | JSON (код) | XML (данные) | MD (Markdown)