Толковый словарь по нейросетям и искусственному интеллекту
Гомография
Категория термина
Гомография (Homography) — матричное преобразование, описывающее проективное соответствие между двумя плоскими поверхностями в изображениях. Оно используется для выравнивания, совмещения и трансформации изображений, когда необходимо учесть перспективные искажения или изменение плоскости объекта.
🧠 Механизм работы
- Определяются наборы соответствующих точек на двух изображениях.
- Вычисляется матрица гомографии HH, которая связывает координаты точек: x′=Hxx' = Hx, где xx и x′x' — гомогенные координаты точек на исходном и целевом изображениях.
- Применяется матрица HH для трансформации всего изображения или выделенной области, корректируя перспективу и выравнивая объекты.
🔑 Особенности
- Преобразование учитывает проективные искажения, но не учитывает деформации вне плоскости.
- Используется для изображений с планарными объектами или сценами, где один объект можно аппроксимировать плоскостью.
- Часто вычисляется с помощью алгоритмов RANSAC для устойчивости к выбросам.
📌 Примеры применения
- Сшивание панорам: выравнивание нескольких изображений для получения единой сцены.
- Калибровка камер: исправление перспективных искажений в изображениях.
- Дополненная реальность: накладывание виртуальных объектов на плоские поверхности в видео.
- Робототехника и дроны: навигация и корректировка изображений для локализации.
⚖️ Преимущества и недостатки
Преимущества:
- Позволяет точно выравнивать изображения и исправлять перспективу.
- Эффективен для плоских объектов и сцен.
- Хорошо работает совместно с методами обнаружения ключевых точек (SIFT, ORB).
Недостатки:
- Не применим для сильно изогнутых или трёхмерно деформированных поверхностей.
- Чувствителен к ошибкам в подборе соответствующих точек без устойчивых алгоритмов (например, RANSAC).
🧠 Связанные понятия
- Perspective Transformation — более общий вид проективного преобразования.
- RANSAC — алгоритм для устойчивого вычисления гомографии.
- Feature Matching — поиск соответствующих точек для вычисления матрицы.
- Planar Scenes — сцены, где объекты можно аппроксимировать плоскостью.
- Image Registration — выравнивание и совмещение изображений.
💡 Вывод
Гомография — ключевой инструмент в компьютерном зрении для работы с изображениями и видео. Она позволяет корректировать перспективу и выравнивать плоские объекты, обеспечивая точность в приложениях от панорамирования до дополненной реальности.