Detecção de objeto - Object detection

Objetos detectados com o módulo Deep Neural Network (dnn) do OpenCV usando um modelo YOLOv3 treinado em conjunto de dados COCO capaz de detectar objetos de 80 classes comuns.

A detecção de objetos é uma tecnologia de computador relacionada à visão computacional e ao processamento de imagens que lida com a detecção de instâncias de objetos semânticos de uma determinada classe (como humanos, edifícios ou carros) em imagens e vídeos digitais. Domínios bem pesquisados de detecção de objetos incluem detecção de rosto e detecção de pedestres . A detecção de objetos tem aplicações em muitas áreas da visão computacional, incluindo recuperação de imagens e vigilância por vídeo .

Usos

Detecção de objetos de uma estrada

É amplamente utilizado em visão computacional tarefas como anotação de imagem , contagem de veículos, reconhecimento de atividade , detecção de face , reconhecimento de face , vídeo co-segmentação objeto . Também é usado para rastrear objetos , por exemplo, rastrear uma bola durante uma partida de futebol, rastrear o movimento de um taco de críquete ou rastrear uma pessoa em um vídeo.

Conceito

Cada classe de objeto tem seus próprios recursos especiais que ajudam na classificação da classe - por exemplo, todos os círculos são redondos. A detecção de classe de objeto usa esses recursos especiais. Por exemplo, ao procurar por círculos, os objetos que estão a uma determinada distância de um ponto (ou seja, o centro) são procurados. Da mesma forma, ao procurar quadrados, objetos que são perpendiculares nos cantos e têm comprimentos laterais iguais são necessários. Uma abordagem semelhante é usada para identificação de rosto, onde olhos, nariz e lábios podem ser encontrados e características como cor da pele e distância entre os olhos podem ser encontradas.

Métodos

Comparação de velocidade e precisão de vários detectores no conjunto de dados Microsoft COCO testdev https://cocodataset.org (todos os valores são encontrados em https://arxiv.org artigos dos autores desses algoritmos)

Métodos para detecção de objetos geralmente se enquadram em abordagens baseadas em rede neural ou não neurais. Para abordagens não neurais, é necessário primeiro definir as características usando um dos métodos abaixo e, em seguida, usando uma técnica como máquina de vetores de suporte (SVM) para fazer a classificação. Por outro lado, as técnicas neurais são capazes de fazer a detecção de objetos ponta a ponta sem definir recursos específicos e são normalmente baseadas em redes neurais convolucionais (CNN).

Abordagens não neurais:
- Estrutura de detecção de objetos Viola-Jones baseada em recursos Haar
- Transformação de recurso invariante de escala (SIFT)
- Histograma de gradientes orientadas (HOG) funcionalidades
Abordagens de rede neural:
- Propostas de região (R-CNN, Fast R-CNN, Faster R-CNN, cascata R-CNN.)
- Detector de caixa múltipla de disparo único (SSD)
- Você só olha uma vez (YOLO)
- Rede neural de refinamento de disparo único para detecção de objetos (RefineDet)
- Retina-Net
- Redes convolucionais deformáveis

Veja também

Referências

"Detecção de classe de objeto" . Vision.eecs.ucf.edu. Arquivado do original em 14/07/2013 . Página visitada em 09/10/2013 .
“ETHZ - Laboratório de Visão Computacional: Publicações” . Vision.ee.ethz.ch. Arquivado do original em 03/06/2013 . Página visitada em 09/10/2013 .

Languages

In other projects