Толковый словарь по нейросетям и искусственному интеллекту

Самостоятельное обучение

Self-Supervised Learning
SSL

Категория термина


Самостоятельное обучение (Self-Supervised Learning, SSL) — это подход в машинном обучении, при котором модель обучается на неразмеченных данных, используя автоматически создаваемые цели (labels) из самих данных. В отличие от полностью контролируемого обучения (supervised learning), где нужны размеченные данные, SSL извлекает сигналы обучения напрямую из структуры данных, что позволяет использовать большие массивы информации без ручной разметки.

🧠 Механизм работы:

  1. Выбирается способ создания псевдо-меток из исходных данных. Например, в тексте это может быть маскировка слов (MLM), а в изображениях — предсказание поворота или заполнение пропусков.
  2. Модель получает входные данные и пытается предсказать автоматически сгенерированные цели.
  3. Обучение происходит с использованием стандартных функций потерь (например, кросс-энтропии или MSE) на этих псевдо-метках.
  4. После предобучения модель может быть дообучена (fine-tuned) на задачах с размеченными данными для достижения высокой точности.

🔑 Основные особенности:

  1. Отсутствие размеченных данных
    • Использует естественную структуру данных для генерации целей обучения.
  2. Предобучение для downstream задач
    • SSL позволяет создавать мощные универсальные представления, которые затем адаптируются к конкретным задачам.
  3. Широкая применимость
    • Подходит для текста, изображений, аудио и мультимодальных данных.

📌 Примеры применения:

  1. NLP
    • Masked Language Modeling (MLM) в BERT, автокодировщики для текста.
  2. Компьютерное зрение
    • Contrastive Learning (SimCLR, MoCo), предсказание пропущенных частей изображений, ротирование и аугментации.
  3. Аудио и речь
    • Предсказание следующего фрейма аудио, представлений для распознавания речи (например, wav2vec).
  4. Мультимодальные модели
    • CLIP использует контрастное обучение между изображениями и текстом для формирования общих представлений.

⚖️ Преимущества и недостатки:

Преимущества:
  • Позволяет использовать огромные объемы неразмеченных данных.
  • Создает универсальные и мощные представления данных.
  • Снижает зависимость от дорогостоящей ручной разметки.
Недостатки:
  • Качество представлений сильно зависит от выбранной предсказательной задачи (pretext task).
  • Не всегда обеспечивает оптимальное решение для конкретной downstream задачи без дообучения.
  • Может быть вычислительно затратным при работе с большими датасетами.

🧠 Связанные понятия:

  • Contrastive Learning — метод SSL, который учит различать похожие и непохожие объекты.
  • Masked Language Modeling (MLM) — пример SSL в NLP.
  • Autoencoders — часто используются в SSL для восстановления входных данных.
  • Fine-tuning — дообучение предобученной SSL модели на размеченных данных.

💡 Вывод:

Self-Supervised Learning (SSL) — это мощный подход к обучению моделей на неразмеченных данных, позволяющий создавать универсальные представления для текста, изображений, аудио и мультимодальных задач. Он уменьшает потребность в ручной разметке и обеспечивает основу для современных трансформеров, контрастных моделей и других передовых архитектур.

🤔 Остались вопросы? Спросите ИИ

Используйте в запросе не более 500 символов.

📌 Последние запросы

  • Почему нет синусной меры сходства? 4 дня назад
  • Почему нет минусной перв сходства? 4 дня назад
  • Здравствуйте можно создать видео танцуешь из фото 7 дней назад

📥 Скачать список терминов (646)

Форматы: TXT (список) | CSV (Excel) | JSON (код) | XML (данные) | MD (Markdown)