Detecção de objeto - Object detection
A detecção de objetos é uma tecnologia de computador relacionada à visão computacional e ao processamento de imagens que lida com a detecção de instâncias de objetos semânticos de uma determinada classe (como humanos, edifícios ou carros) em imagens e vídeos digitais. Domínios bem pesquisados de detecção de objetos incluem detecção de rosto e detecção de pedestres . A detecção de objetos tem aplicações em muitas áreas da visão computacional, incluindo recuperação de imagens e vigilância por vídeo .
Usos
É amplamente utilizado em visão computacional tarefas como anotação de imagem , contagem de veículos, reconhecimento de atividade , detecção de face , reconhecimento de face , vídeo co-segmentação objeto . Também é usado para rastrear objetos , por exemplo, rastrear uma bola durante uma partida de futebol, rastrear o movimento de um taco de críquete ou rastrear uma pessoa em um vídeo.
Conceito
Cada classe de objeto tem seus próprios recursos especiais que ajudam na classificação da classe - por exemplo, todos os círculos são redondos. A detecção de classe de objeto usa esses recursos especiais. Por exemplo, ao procurar por círculos, os objetos que estão a uma determinada distância de um ponto (ou seja, o centro) são procurados. Da mesma forma, ao procurar quadrados, objetos que são perpendiculares nos cantos e têm comprimentos laterais iguais são necessários. Uma abordagem semelhante é usada para identificação de rosto, onde olhos, nariz e lábios podem ser encontrados e características como cor da pele e distância entre os olhos podem ser encontradas.
Métodos
Métodos para detecção de objetos geralmente se enquadram em abordagens baseadas em rede neural ou não neurais. Para abordagens não neurais, é necessário primeiro definir as características usando um dos métodos abaixo e, em seguida, usando uma técnica como máquina de vetores de suporte (SVM) para fazer a classificação. Por outro lado, as técnicas neurais são capazes de fazer a detecção de objetos ponta a ponta sem definir recursos específicos e são normalmente baseadas em redes neurais convolucionais (CNN).
- Abordagens não neurais:
- Abordagens de rede neural:
- Propostas de região (R-CNN, Fast R-CNN, Faster R-CNN, cascata R-CNN.)
- Detector de caixa múltipla de disparo único (SSD)
- Você só olha uma vez (YOLO)
- Rede neural de refinamento de disparo único para detecção de objetos (RefineDet)
- Retina-Net
- Redes convolucionais deformáveis
Veja também
- Detecção de recursos (visão computacional)
- Detecção de objeto em movimento
- Esboço de reconhecimento de objeto
- Algoritmo Teknomo – Fernandez
Referências
- "Detecção de classe de objeto" . Vision.eecs.ucf.edu. Arquivado do original em 14/07/2013 . Página visitada em 09/10/2013 .
- “ETHZ - Laboratório de Visão Computacional: Publicações” . Vision.ee.ethz.ch. Arquivado do original em 03/06/2013 . Página visitada em 09/10/2013 .