Толковый словарь по нейросетям и искусственному интеллекту
Афинное преобразование
Категория термина
Афинное преобразование (Affine Transformation) — математическое преобразование, сохраняющее прямые линии и параллельность, но не обязательно длины и углы. Оно включает операции переноса, поворота, масштабирования, отражения и сдвига (shear), позволяя изменять форму или положение объекта в пространстве при сохранении его линейной структуры.
🧠 Механизм работы
- Исходные координаты точки или изображения задаются в виде вектора.
- К ним применяется матрица преобразования и вектор смещения.
- Результатом является новое положение точек, при котором структура сохраняется, но может измениться размер, ориентация или форма.
- В компьютерном зрении афинное преобразование используется для нормализации изображений или данных перед обучением модели.
🔑 Особенности
- Сохраняет коллинеарность (точки на одной линии остаются на линии).
- Сохраняет отношения параллельности.
- Может менять масштаб, поворачивать и искажать объект.
- Реализуется через матрицы 2×3 (для 2D) или 3×4 (для 3D).
📌 Примеры применения
- Выравнивание лиц в задачах Face Alignment.
- Аугментация данных при обучении нейросетей (например, сдвиги и повороты изображений).
- Геометрическая коррекция изображений в медицинской визуализации.
- Преобразование координат в робототехнике при навигации.
⚖️ Преимущества и недостатки
Преимущества:
- Простота вычислений за счёт матричной формы.
- Универсальность — объединяет несколько базовых преобразований.
Недостатки:
- Не сохраняет углы и длины (в отличие от изометрий).
- Может искажать форму объекта.
🧠 Связанные понятия
- Linear Transformation — преобразование без смещения, частный случай афинного.
- Homography — более общее преобразование, сохраняющее проективные свойства.
- Geometric Augmentation — использование преобразований для увеличения обучающей выборки.
- Pose Normalization — нормализация позы с помощью афинных преобразований.
- Rotation Matrix — частный случай для поворотов.
💡 Вывод
Афинное преобразование является фундаментальным инструментом в компьютерном зрении и машинном обучении, позволяя выполнять гибкие геометрические преобразования данных. Оно сохраняет базовую структуру объектов, обеспечивая удобный баланс между простотой и универсальностью.