Толковый словарь по нейросетям и искусственному интеллекту
Самостоятельное обучение
Self-Supervised Learning
SSL
Категория термина
Самостоятельное обучение (Self-Supervised Learning, SSL) — это подход в машинном обучении, при котором модель обучается на неразмеченных данных, используя автоматически создаваемые цели (labels) из самих данных. В отличие от полностью контролируемого обучения (supervised learning), где нужны размеченные данные, SSL извлекает сигналы обучения напрямую из структуры данных, что позволяет использовать большие массивы информации без ручной разметки.
🧠 Механизм работы:
- Выбирается способ создания псевдо-меток из исходных данных. Например, в тексте это может быть маскировка слов (MLM), а в изображениях — предсказание поворота или заполнение пропусков.
- Модель получает входные данные и пытается предсказать автоматически сгенерированные цели.
- Обучение происходит с использованием стандартных функций потерь (например, кросс-энтропии или MSE) на этих псевдо-метках.
- После предобучения модель может быть дообучена (fine-tuned) на задачах с размеченными данными для достижения высокой точности.
🔑 Основные особенности:
- Отсутствие размеченных данных
- Использует естественную структуру данных для генерации целей обучения.
- Предобучение для downstream задач
- SSL позволяет создавать мощные универсальные представления, которые затем адаптируются к конкретным задачам.
- Широкая применимость
- Подходит для текста, изображений, аудио и мультимодальных данных.
📌 Примеры применения:
- NLP
- Masked Language Modeling (MLM) в BERT, автокодировщики для текста.
- Компьютерное зрение
- Аудио и речь
- Предсказание следующего фрейма аудио, представлений для распознавания речи (например, wav2vec).
- Мультимодальные модели
- CLIP использует контрастное обучение между изображениями и текстом для формирования общих представлений.
⚖️ Преимущества и недостатки:
Преимущества:- Позволяет использовать огромные объемы неразмеченных данных.
- Создает универсальные и мощные представления данных.
- Снижает зависимость от дорогостоящей ручной разметки.
- Качество представлений сильно зависит от выбранной предсказательной задачи (pretext task).
- Не всегда обеспечивает оптимальное решение для конкретной downstream задачи без дообучения.
- Может быть вычислительно затратным при работе с большими датасетами.
🧠 Связанные понятия:
- Contrastive Learning — метод SSL, который учит различать похожие и непохожие объекты.
- Masked Language Modeling (MLM) — пример SSL в NLP.
- Autoencoders — часто используются в SSL для восстановления входных данных.
- Fine-tuning — дообучение предобученной SSL модели на размеченных данных.