Este livro apresenta uma abordagem prática e acessível para o reconhecimento de imagens com o modelo Vision Transformer (ViT), uma arquitetura de aprendizado profundo desenvolvida para aplicar o poder dos transformadores — originalmente projetados para linguagem natural — à área da visão computacional. Através de um exemplo programado em Python, o leitor será guiado na utilização do modelo ViT para classificar imagens reais, inclusive a partir de links da internet, utilizando ferramentas modernas como a biblioteca transformers da Hugging Face. O conteúdo abrange desde o pré-processamento da imagem com o extrator de características até a inferência final com o modelo pré-treinado, permitindo ao leitor compreender como o ViT identifica padrões visuais e associa rótulos a imagens. Esta é uma excelente introdução para estudantes, desenvolvedores e entusiastas que desejam explorar os avanços da inteligência artificial em aplicações visuais do mundo real.
Número de páginas | 107 |
Edição | 1 (2025) |
Formato | A5 (148x210) |
Acabamento | Brochura c/ orelha |
Tipo de papel | Couche 90g |
Idioma | Português |
Tem algo a reclamar sobre este livro? Envie um email para atendimento@clubedeautores.com.br
Faça o login deixe o seu comentário sobre o livro.