Толковый словарь по нейросетям и искусственному интеллекту
Геометрическое увеличение данных
Категория термина
Геометрическое увеличение данных (Geometric Augmentation) — метод предобработки данных, при котором исходные изображения или объекты модифицируются с помощью геометрических трансформаций для увеличения объёма обучающей выборки. Это позволяет повысить устойчивость моделей к вариациям и улучшить их обобщающую способность.
🧠 Механизм работы
- Исходное изображение или объект подвергается трансформациям, которые сохраняют семантическую информацию.
- Распространённые операции включают повороты, отражения, масштабирование, сдвиги, аффинные преобразования и кроппинг.
- Полученные варианты добавляются в обучающую выборку, расширяя её и создавая разнообразие условий для обучения модели.
🔑 Особенности
- Улучшает обобщающую способность моделей, снижая переобучение.
- Сохраняет ключевую семантику данных при изменении визуальных характеристик.
- Часто используется в комбинации с цветовой аугментацией и шумовой модификацией.
📌 Примеры применения
- Компьютерное зрение: увеличение числа изображений для классификации объектов, обнаружения или сегментации.
- Распознавание лиц: повороты и отражения лиц для повышения устойчивости к ракурсам.
- Автономные транспортные системы: повороты, кроппинг и масштабирование дорожных сцен для обучения моделей распознавания дорожных объектов.
- Обработка медицинских изображений: трансформации сканов для повышения устойчивости к вариациям позы или масштаба.
⚖️ Преимущества и недостатки
Преимущества:
- Увеличивает размер и разнообразие обучающей выборки без необходимости сбора новых данных.
- Повышает устойчивость моделей к различным ориентациям и масштабам объектов.
- Прост в реализации и широко поддерживается современными библиотеками (PyTorch, TensorFlow).
Недостатки:
- Избыточное увеличение может привести к введению артефактов или искажений данных.
- Не всегда подходит для задач, где точные пространственные соотношения критичны.
🧠 Связанные понятия
- Data Augmentation — общий термин для всех методов увеличения данных.
- Affine Transformation — линейная геометрическая трансформация, часто используемая в аугментации.
- Rotation / Flipping / Cropping — отдельные геометрические операции аугментации.
- Image Preprocessing — подготовка и модификация изображений перед подачей в модель.
- Robustness — устойчивость модели к изменениям данных.
💡 Вывод
Geometric Augmentation является фундаментальной техникой повышения качества обучения моделей компьютерного зрения. Она позволяет моделям быть более устойчивыми к вариациям данных и снижает риск переобучения, при этом сохраняя семантическую целостность исходных изображений.