Толковый словарь по нейросетям и искусственному интеллекту
Сегментационные маски
Категория термина
Сегментационные маски (Segmentation Masks) — это изображения или матрицы, где каждому пикселю присвоена метка, обозначающая принадлежность к определённому объекту или области. В генеративных и компьютерно-зрительных задачах они используются для точного выделения частей изображения, что позволяет моделям, таким как Stable Diffusion, выполнять inpainting, outpainting или условную генерацию с учётом конкретных объектов.
🧠 Механизм работы
- Каждому пикселю изображения присваивается категория или метка (например, фон, объект, лицо).
- Модель использует маску как условие для генерации или редактирования изображения: пиксели с определёнными метками остаются неизменными или изменяются в соответствии с заданием.
- Во время inpainting masked области заменяются или корректируются, сохраняя контекст вокруг маски.
- Для outpainting и canvas expansion маски помогают точно определять границы расширяемых областей.
🔑 Особенности
- Используются как визуальные условия для conditional generation.
- Позволяют изолировать объекты и управлять процессом генерации на уровне пикселей.
- Применимы для inpainting, outpainting и fine-tuning моделей на конкретные объекты.
- Требуют точного соответствия маски и исходного изображения для корректной работы.
📌 Примеры применения
- Inpainting лица или объектов на изображении с сохранением остальной сцены.
- Outpainting и расширение изображения за границы исходного кадра.
- LoRA или DreamBooth: использование масок для точечной дообучения модели на конкретных областях.
- Автоматическое удаление нежелательных объектов и их замена по маске.
⚖️ Преимущества и недостатки
Преимущества:
- Позволяют точечно контролировать генерацию и редактирование изображений.
- Обеспечивают возможность изолированного изменения частей изображения.
- Совместимы с текстовыми и другими условиями генерации.
Недостатки:
- Требуют аккуратного создания масок; ошибки могут привести к артефактам.
- Дополнительный этап подготовки данных увеличивает время работы.
- Маски сложных объектов или сцен могут быть трудоемкими для ручного создания.
🧠 Связанные понятия
- Inpainting / Outpainting — задачи, для которых применяются маски.
- Conditional Generation — генерация с учётом масок и других условий.
- Annotation / Metadata — исходные данные для создания масок.
- Canvas Expansion — расширение изображения с помощью масок.
- Segmentation Dataset — набор данных с размеченными масками для обучения моделей.
💡 Вывод
Сегментационные маски являются ключевым инструментом для точного управления генерацией и редактированием изображений в нейросетях. Они позволяют моделям типа Stable Diffusion изолированно изменять выбранные области, обеспечивая высокую точность и контроль процесса генерации.