Толковый словарь по нейросетям и искусственному интеллекту

Функция потерь перекрёстной энтропии

Cross-Entropy Loss

Категория термина


Функция потерь перекрёстной энтропии (Cross-Entropy Loss) — это мера расхождения между истинным распределением классов и предсказанным распределением модели. Она широко используется в задачах классификации, включая бинарную и многоклассовую, так как напрямую оценивает, насколько вероятностные предсказания модели соответствуют реальным меткам.

🧠 Механизм работы:

  • Для бинарной классификации (Binary Cross-Entropy):
L=−1N∑i=1N[yilog⁡(pi)+(1−yi)log⁡(1−pi)]L = - frac{1}{N} sum_{i=1}^{N} left[ y_i log(p_i) + (1 - y_i) log(1 - p_i) right]

где yiy_i — истинная метка (0 или 1), pip_i — предсказанная вероятность класса 1, NN — число примеров.

  • Для многоклассовой классификации (Categorical Cross-Entropy):
L=−1N∑i=1N∑k=1Kyiklog⁡(pik)L = - frac{1}{N} sum_{i=1}^{N} sum_{k=1}^{K} y_{ik} log(p_{ik})

где yiky_{ik} — индикатор того, принадлежит ли пример ii классу kk, pikp_{ik} — предсказанная вероятность для класса kk, KK — число классов.

🔑 Основные особенности:

  • Штрафует модель сильнее, если она уверенно ошибается.
  • Сильно связана с функцией Softmax на выходном слое.
  • Дифференцируема, что позволяет использовать градиентные методы оптимизации.
  • Прямая интерпретация: минимизация перекрёстной энтропии эквивалентна максимизации правдоподобия (Maximum Likelihood) предсказаний модели.

📌 Примеры применения:

⚖️ Преимущества и недостатки:

Преимущества:

  • Естественная функция потерь для вероятностных предсказаний.
  • Подходит как для бинарной, так и для многоклассовой классификации.
  • Дифференцируемость обеспечивает эффективное обучение с помощью градиентного спуска.

Недостатки:

  • Чувствительна к несбалансированным классам; может отдавать предпочтение более частым классам.
  • Требует аккуратной обработки нулевых и очень малых вероятностей, чтобы избежать численных проблем.
  • Модель может быть чрезмерно уверенной в ошибочных предсказаниях без регуляризации.

🧠 Связанные понятия:

  • Softmax — обычно применяется вместе с Cross-Entropy для многоклассовой классификации.
  • Sigmoid — используется с Binary Cross-Entropy для двух классов.
  • Maximum Likelihood Estimation (MLE) — минимизация перекрёстной энтропии эквивалентна максимизации правдоподобия.
  • Label Smoothing — метод сглаживания меток для уменьшения переобучения.

💡 Вывод:

Функция потерь перекрёстной энтропии (Cross-Entropy Loss) — это фундаментальный инструмент обучения классификационных моделей, позволяющий эффективно оценивать расхождение между предсказанными и истинными вероятностями. Она обеспечивает стабильное и интерпретируемое обучение как в бинарных, так и в многоклассовых задачах.

🤔 Остались вопросы? Спросите ИИ

Используйте в запросе не более 500 символов.

📌 Последние запросы

  • Почему нет синусной меры сходства? 3 дня назад
  • Почему нет минусной перв сходства? 3 дня назад
  • Здравствуйте можно создать видео танцуешь из фото 6 дней назад

📥 Скачать список терминов (646)

Форматы: TXT (список) | CSV (Excel) | JSON (код) | XML (данные) | MD (Markdown)