Толковый словарь по нейросетям и искусственному интеллекту
Обнаружение объектов
Категория термина
Обнаружение объектов (Object Detection) — это задача компьютерного зрения, направленная на определение местоположения и классификацию одного или нескольких объектов на изображении или в видеопотоке. В отличие от простой классификации изображений, которая определяет, что изображено в кадре, обнаружение объектов также отвечает на вопрос "где именно" находится каждый объект, выделяя его с помощью ограничивающей рамки (bounding box).
🧠 Ключевые элементы:
- Классификация объекта – определение класса (например, "собака", "автомобиль", "человек").
- Локализация объекта – координаты рамки, обрамляющей объект (обычно: x, y, ширина, высота).
- Множественные объекты – возможность обнаружить несколько различных объектов в одном изображении.
- Confidence Score – вероятность принадлежности объекта к определённому классу.
🛠️ Алгоритмы и модели:
🔹 Классические:
- Haar Cascades (OpenCV)
- HOG + SVM – для обнаружения людей и автомобилей
🔹 Современные нейросетевые:
- R-CNN, Fast R-CNN, Faster R-CNN – основаны на выделении регионов
- YOLO (You Only Look Once) – семейство сверхбыстрых моделей, включая YOLOv5, YOLOv8
- SSD (Single Shot MultiBox Detector) – баланс точности и скорости
- DETR (DEtection TRansformer) – использует архитектуру Transformer
- EfficientDet – эффективная и компактная модель от Google
🖼️ Применение:
| Область | Примеры применения |
|---|---|
| Безопасность | Обнаружение лиц, вторжений, оружия |
| Автомобили | Системы помощи водителю (ADAS), автономное вождение |
| Медицина | Поиск опухолей и аномалий на снимках |
| Ритейл | Подсчёт покупателей, слежение за продуктами на полках |
| Промышленность | Контроль качества на производственной линии |
| Агро | Подсчёт плодов, обнаружение сорняков или вредителей |
🧮 Метрики качества:
- Precision / Recall – точность и полнота обнаружения
- IoU (Intersection over Union) – мера перекрытия предсказанной рамки с реальной
- mAP (mean Average Precision) – средняя точность по всем классам и порогам IoU
🧩 Взаимосвязь с другими задачами:
- Image Classification – определяет только класс, без локализации
- Semantic Segmentation – помечает каждый пиксель изображения (границы объектов точнее, но не выделяются рамки)
- Instance Segmentation – объединяет обнаружение и сегментацию (например, модель Mask R-CNN)
🔍 Особенности:
- Требует размеченных данных с рамками (bounding boxes), например в формате COCO, Pascal VOC, YOLO.
- Чувствительно к размерам, наклонам и частичному перекрытию объектов.
- Часто нуждается в аугментации данных: повороты, изменение освещённости, масштабирование.
- Может использоваться в реальном времени (например, YOLO), в отличие от более медленных моделей (Faster R-CNN).
🧪 Примеры библиотек:
- Detectron2 (Facebook AI)
- Ultralytics YOLO – удобный интерфейс, обучение и вывод в один клик
- MMDetection (OpenMMLab)
- OpenCV + ONNX Runtime – для вывода обученных моделей
- TensorFlow Object Detection API
🧭 Заключение:
Обнаружение объектов — фундаментальная задача в компьютерном зрении, лежащая в основе многих прикладных решений: от автономных автомобилей до анализа медицинских снимков. Благодаря развитию моделей и доступности готовых фреймворков, интеграция object detection в реальный бизнес или научный проект стала возможна даже для индивидуальных разработчиков. Сочетание скорости, точности и способности работать в реальном времени делает эту технологию ключевым инструментом в современном мире ИИ.