Толковый словарь по нейросетям и искусственному интеллекту
Многоклассовая классификация
Категория термина
Многоклассовая классификация — это тип задачи машинного обучения, при котором каждый входной пример должен быть отнесён к одному из трёх и более классов. В отличие от бинарной классификации (2 класса), многоклассовая классификация решает более сложную проблему: различение между несколькими категориями, причём каждый объект принадлежит только одному классу.
🧠 Примеры из практики:
- Распознавание рукописных цифр (0–9)
- Классификация животных по изображениям (кот, собака, птица, лошадь и т.д.)
- Определение эмоций по тексту (радость, гнев, грусть, страх, удивление и т.п.)
- Тематическая категоризация новостей (спорт, экономика, наука, культура)
🧩 Подходы к решению:
1. One-vs-Rest (OvR):
Модель обучается для каждого класса отдельно: "этот класс против всех остальных". Для k классов — k моделей. Затем выбирается класс с наибольшим откликом.
2. One-vs-One (OvO):
Обучается k(k-1)/2 бинарных моделей для каждой пары классов. Класс, набравший наибольшее число "побед" в сравнениях, выбирается как итоговый.
3. Softmax + Cross-Entropy:
Современные нейросетевые модели используют Softmax-функцию на выходе и функцию потерь Cross-Entropy, которая измеряет разницу между истинной меткой и вероятностным распределением по классам.
📏 Метрики оценки:
- Accuracy: Общая доля правильных классификаций.
- Precision, Recall, F1-score: Рассчитываются для каждого класса и усредняются (по микро- или макро-подходу).
- Confusion Matrix: Показывает, как классы путаются между собой.
🧪 Пример:
Задача: классификация вида фруктов
Классы: 🍎 Яблоко, 🍌 Банан, 🍇 Виноград, 🍊 Апельсин
- Вход: изображение фрукта
- Модель предсказывает:
[Яблоко: 0.1, Банан: 0.05, Виноград: 0.8, Апельсин: 0.05] - Ответ: Виноград (наибольшая вероятность по Softmax)
💡 Важные аспекты:
- Несбалансированные классы требуют специальных техник: взвешенные метрики, увеличение числа редких примеров, переобучение.
- Обучение модели усложняется по мере увеличения числа классов — растёт размер выходного слоя и сложность задачи.
- Ошибки между "похожими" классами (например, между 4 и 9 в рукописных цифрах) — распространённая проблема.
🧭 Применение:
- Компьютерное зрение (ImageNet, CIFAR-100)
- Обработка естественного языка (определение темы, тональности, жанра)
- Рекомендательные системы (категоризация товаров, предпочтений)
- Медицина (диагностика из множества заболеваний)
📌 Заключение:
Многоклассовая классификация — ключевая задача в машинном обучении, особенно при работе с реальными данными, где объектов часто больше двух категорий. Эффективная реализация требует сбалансированных данных, корректной архитектуры модели и выбора подходящих метрик.