Толковый словарь по нейросетям и искусственному интеллекту
Mapping Network
Категория термина
Mapping Network — это компонент генеративной архитектуры StyleGAN, который преобразует латентный вектор из исходного латентного пространства Z в промежуточное латентное пространство W. Цель Mapping Network — создать более «удобное» для генератора представление, которое упрощает управление стилями и позволяет лучше разделять глобальные и локальные атрибуты генерируемого изображения.
🧠 Механизм работы:
- На вход Mapping Network подается латентный вектор z, обычно случайно сгенерированный из нормального распределения.
- Вектор z пропускается через несколько полностью связанных слоев (fully connected layers) с активациями, формируя промежуточный вектор w.
- Вектор w передается на генератор через механизм AdaIN, управляя стилем и атрибутами изображения на разных уровнях сети.
- Промежуточное пространство W обеспечивает более линейное и удобное распределение для манипуляции стилями по сравнению с исходным латентным пространством Z.
🔑 Основные особенности:
- Преобразование латентного пространства
- Mapping Network переводит случайный вектор z в пространство W, где стили лучше разделены и управляемы.
- Управление стилем
- Промежуточный вектор w позволяет изменять глобальные и локальные атрибуты изображения через генератор.
- Многослойная структура
- Состоит из нескольких fully connected слоев с нелинейными активациями для сложного преобразования.
📌 Примеры применения:
- StyleGAN генерация изображений
- Mapping Network формирует вектор w для управления стилем лиц, объектов или сцен.
- Локальная и глобальная манипуляция атрибутами
- Позволяет изменять выражение лица, позу, цветовую палитру или детали текстур без вмешательства в другие аспекты.
- Семантическое редактирование
- Промежуточное пространство W используется для редактирования изображений на семантическом уровне, управляя понятными визуальными характеристиками.
⚖️ Преимущества и недостатки:
Преимущества:- Обеспечивает более линейное и управляемое латентное пространство для генератора.
- Позволяет легко изменять глобальные и локальные атрибуты изображения через AdaIN.
- Улучшает качество и стабильность обучения StyleGAN.
- Добавляет дополнительные слои и вычислительные затраты в архитектуру генератора.
- Требует тщательного обучения, чтобы промежуточное пространство W было действительно «удобным» для манипуляций.
- Не исключает полностью сложность нелинейных зависимостей в генераторе.
🧠 Связанные понятия:
- StyleGAN — генеративная архитектура, в которой Mapping Network используется для управления стилями.
- Latent Space Z — исходное латентное пространство, из которого генерируется вектор z.
- Latent Space W — промежуточное пространство, формируемое Mapping Network для удобного управления стилями.
- AdaIN — механизм, применяющий вектор w для управления стилем на уровнях генератора.