Толковый словарь по нейросетям и искусственному интеллекту

Обнаружение объектов

Object Detection

Категория термина


Обнаружение объектов (Object Detection) — это задача компьютерного зрения, направленная на определение местоположения и классификацию одного или нескольких объектов на изображении или в видеопотоке. В отличие от простой классификации изображений, которая определяет, что изображено в кадре, обнаружение объектов также отвечает на вопрос "где именно" находится каждый объект, выделяя его с помощью ограничивающей рамки (bounding box).


🧠 Ключевые элементы:

  • Классификация объекта – определение класса (например, "собака", "автомобиль", "человек").
  • Локализация объекта – координаты рамки, обрамляющей объект (обычно: x, y, ширина, высота).
  • Множественные объекты – возможность обнаружить несколько различных объектов в одном изображении.
  • Confidence Score – вероятность принадлежности объекта к определённому классу.

🛠️ Алгоритмы и модели:

🔹 Классические:

  • Haar Cascades (OpenCV)
  • HOG + SVM – для обнаружения людей и автомобилей

🔹 Современные нейросетевые:

  • R-CNN, Fast R-CNN, Faster R-CNN – основаны на выделении регионов
  • YOLO (You Only Look Once) – семейство сверхбыстрых моделей, включая YOLOv5, YOLOv8
  • SSD (Single Shot MultiBox Detector) – баланс точности и скорости
  • DETR (DEtection TRansformer) – использует архитектуру Transformer
  • EfficientDet – эффективная и компактная модель от Google

🖼️ Применение:

ОбластьПримеры применения
БезопасностьОбнаружение лиц, вторжений, оружия
АвтомобилиСистемы помощи водителю (ADAS), автономное вождение
МедицинаПоиск опухолей и аномалий на снимках
РитейлПодсчёт покупателей, слежение за продуктами на полках
ПромышленностьКонтроль качества на производственной линии
АгроПодсчёт плодов, обнаружение сорняков или вредителей

🧮 Метрики качества:

  • Precision / Recallточность и полнота обнаружения
  • IoU (Intersection over Union) – мера перекрытия предсказанной рамки с реальной
  • mAP (mean Average Precision) – средняя точность по всем классам и порогам IoU

🧩 Взаимосвязь с другими задачами:

  • Image Classification – определяет только класс, без локализации
  • Semantic Segmentation – помечает каждый пиксель изображения (границы объектов точнее, но не выделяются рамки)
  • Instance Segmentation – объединяет обнаружение и сегментацию (например, модель Mask R-CNN)

🔍 Особенности:

  • Требует размеченных данных с рамками (bounding boxes), например в формате COCO, Pascal VOC, YOLO.
  • Чувствительно к размерам, наклонам и частичному перекрытию объектов.
  • Часто нуждается в аугментации данных: повороты, изменение освещённости, масштабирование.
  • Может использоваться в реальном времени (например, YOLO), в отличие от более медленных моделей (Faster R-CNN).

🧪 Примеры библиотек:

  • Detectron2 (Facebook AI)
  • Ultralytics YOLO – удобный интерфейс, обучение и вывод в один клик
  • MMDetection (OpenMMLab)
  • OpenCV + ONNX Runtime – для вывода обученных моделей
  • TensorFlow Object Detection API

🧭 Заключение:

Обнаружение объектов — фундаментальная задача в компьютерном зрении, лежащая в основе многих прикладных решений: от автономных автомобилей до анализа медицинских снимков. Благодаря развитию моделей и доступности готовых фреймворков, интеграция object detection в реальный бизнес или научный проект стала возможна даже для индивидуальных разработчиков. Сочетание скорости, точности и способности работать в реальном времени делает эту технологию ключевым инструментом в современном мире ИИ.

🤔 Остались вопросы? Спросите ИИ

Используйте в запросе не более 500 символов.

📌 Последние запросы

  • Нарисуй мне игральную карту как из игры Hearthstone. На ней должен быть изображён молодой парень в о… 1 неделя назад
  • Как выбрать размер сглаживания? 2 недели назад
  • Сможешь поределить значение подписи 2 недели назад

📥 Скачать список терминов (646)

Форматы: TXT (список) | CSV (Excel) | JSON (код) | XML (данные) | MD (Markdown)