O avanço da visão computacional tem permitido que computadores e sistemas embarcados interpretem o mundo visual de maneira cada vez mais próxima à percepção humana. Entre as técnicas modernas, o uso de redes neurais convolucionais (CNNs) e arquiteturas de detecção de objetos e segmentação tem se mostrado essencial para aplicações em segurança, veículos autônomos, análise de imagens médicas e robótica.
Neste trabalho, será apresentado o uso do Detectron2, uma biblioteca desenvolvida pelo Facebook AI Research (FAIR), que oferece modelos pré-treinados de última geração para detecção de objetos, segmentação de instâncias e reconhecimento de imagens. Utilizando a linguagem Python e a infraestrutura do Google Colab, será demonstrado como aplicar o modelo Mask R-CNN pré-treinado no conjunto de dados COCO, capaz de identificar e segmentar múltiplos objetos em imagens reais.
A proposta é fornecer um exemplo prático e didático, no qual uma imagem é baixada da internet, processada e submetida ao modelo, que retorna não apenas os objetos detectados, mas também as suas máscaras, caixas delimitadoras, classes e níveis de confiança. Dessa forma, o leitor terá uma visão clara de como configurar, executar e interpretar os resultados de um pipeline completo de reconhecimento de imagens com Detectron2.
Número de páginas | 109 |
Edição | 1 (2025) |
Formato | A5 (148x210) |
Acabamento | Brochura c/ orelha |
Tipo de papel | Couche 90g |
Idioma | Português |
Tem algo a reclamar sobre este livro? Envie um email para atendimento@clubedeautores.com.br
Faça o login deixe o seu comentário sobre o livro.