Толковый словарь по нейросетям и искусственному интеллекту
Масштабирование без классификатора
Категория термина
Масштабирование без классификатора (Classifier-Free Guidance, CFG) — метод управления генеративными моделями, позволяющий усиливать влияние текстовой подсказки на создаваемый контент без использования отдельного классификатора. Он обеспечивает баланс между точным следованием промпту и творческой вариативностью результатов генерации.
🧠 Механизм работы
При генерации изображения модель вычисляет два набора градиентов: один с учётом текстовой подсказки (conditioned), другой — без подсказки (unconditioned). Разница между ними масштабируется с помощью коэффициента CFG Scale, что позволяет усиливать или ослаблять влияние промпта. Этот подход позволяет модели оставаться гибкой: она может как строго следовать инструкции, так и создавать более разнообразные и креативные результаты.
🔑 Особенности
- Не требует отдельного классификатора для управления генерацией.
- Использует комбинированные градиенты conditioned/unconditioned для контроля результата.
- Позволяет гибко настраивать степень влияния текста через CFG Scale.
- Обеспечивает предсказуемость при высоких значениях и творческую вариативность при низких.
📌 Примеры применения
- Создание изображений, строго соответствующих текстовому описанию, с помощью увеличенного CFG Scale.
- Генерация концепт-арта с низкой привязкой к промпту для экспериментов с визуальными стилями.
- Подбор оптимального уровня влияния подсказки при генерации множества вариантов одной сцены.
⚖️ Преимущества и недостатки
Преимущества:
- Управление соответствием результата промпту без отдельного классификатора.
- Контроль баланса между точностью и креативностью.
- Универсальность применения для различных типов контента (изображения, видео, 3D).
Недостатки:
- Слишком высокие значения могут создавать излишне «жёсткие» изображения.
- Слишком низкие значения снижают точность соответствия промпту и увеличивают вероятность нежелательных артефактов.
🧠 Связанные понятия
- CFG Scale — коэффициент масштабирования влияния промпта на генерацию.
- Prompt — текстовая инструкция для модели.
- Seed — начальное число случайной последовательности для генерации.
- Randomness — элемент случайности в процессе генерации.
- Latent Space — пространство признаков, в котором формируются изображения.
💡 Вывод
Classifier-Free Guidance позволяет управлять генеративной моделью без привлечения дополнительного классификатора, усиливая или ослабляя влияние текстовой подсказки. Этот метод обеспечивает контроль над точностью, стилем и вариативностью результата, делая генерацию более предсказуемой и одновременно гибкой.