Толковый словарь по нейросетям и искусственному интеллекту
Генеративная модель
Категория термина
Генеративная модель (Generative Model) — это тип модели машинного обучения, которая учится понимать распределение данных и способна генерировать новые, правдоподобные образцы, похожие на те, на которых она обучалась.
В отличие от дискриминативных моделей (которые просто классифицируют или предсказывают метки), генеративная модель может создавать новые данные с нуля — будь то изображения, текст, аудио, видео или табличные данные.
🔁 Как это работает:
Генеративная модель оценивает вероятностное распределение исходных данных (например, P(x)P(x) или P(x∣z)P(x|z)), где:
- xx — наблюдаемые данные,
- zz — скрытые переменные или латентное пространство (внутреннее представление данных).
Она учится воспроизводить новые данные, выбирая значения из этого распределения.
🔨 Примеры генеративных моделей:
| Модель | Применение | Краткое описание |
|---|---|---|
| GAN (Generative Adversarial Network) | Изображения, видео, аудио | Состоит из генератора и дискриминатора, «соревнующихся» друг с другом. |
| VAE (Variational Autoencoder) | Сжатие и генерация изображений | Обучается представлять данные в латентном пространстве и реконструировать их. |
| Autoregressive Models (GPT, PixelRNN) | Текст, изображения | Предсказывают следующее значение по предыдущим. |
| Diffusion Models (Stable Diffusion, DALL·E 3) | Высококачественные изображения | Постепенно «очищают» шум, чтобы получить изображение. |
| Normalizing Flows | Точные вероятностные модели | Преобразуют простое распределение в сложное с помощью обратимых функций. |
📈 Области применения:
- Генерация изображений (портретов, логотипов, арта)
- Создание текстов (эссе, статьи, коды)
- Синтез аудио (музыка, голос)
- Deepfake-видео (контроверсиальное применение)
- Заполнение пропущенных данных
- Обучение без учителя (unsupervised learning)
- Аугментация данных для улучшения моделей
🎯 Примеры:
- GPT-4 — генеративная языковая модель, предсказывающая следующую часть текста.
- DALL·E — создаёт изображения на основе текстового описания.
- StyleGAN — создаёт реалистичные человеческие лица, которых не существует.
- MusicLM — генерирует музыку по описанию.
- Tabular GAN — генерирует табличные данные для банков, медицины и др.
⚖️ Отличие от дискриминативных моделей:
| Характеристика | Генеративная модель | Дискриминативная модель |
|---|---|---|
| Цель | Сгенерировать данные | Классифицировать / предсказать |
| Изучает | P(x)P(x) или P(x,y)P(x, y) | ( P(y |
| Пример | GPT, DALL·E | ResNet, BERT-классификатор |
🧩 Связанные термины:
- Latent Space (латентное пространство)
- Sampling (выборка)
- Reconstruction (восстановление)
- Loss Function (например, KL-дивергенция, BCE, Perceptual Loss)
✅ Заключение:
Генеративные модели — это основа современных достижений в области искусственного интеллекта. Они позволяют не только воспроизводить и имитировать реальность, но и создавать принципиально новое — от арта до научных гипотез. Их применение меняет облик креативных профессий, научных исследований и технологий в целом.