Uma vista próxima de uma máquina de classificação de maçãs em operação, monitorada por uma solução de visão computacional. As caixas azuis com a palavra “estragadas” aparecem sobre três maçãs.

IA de visão computacional: aumente a automação e a eficiência vendo os dados de uma nova maneira

Alcance o equilíbrio ideal entre custo e desempenho para sua iniciativa de IA de visão computacional com o portfólio abrangente de hardware e software da Intel®.

Principais conclusões sobre a IA de visão computacional

  • A visão computacional é um tipo de IA que permite que computadores e sistemas atuem com base em percepções derivadas de imagens e dados de vídeo.

  • As organizações estão aplicando a visão computacional a uma variedade de casos de uso para possibilitar automação aprimorada, eficiência e valor.

  • A Intel oferece ferramentas poderosas de software de código aberto para ajudar desenvolvedores e cientistas de dados a proteger e simplificar as implantações em sistemas distribuídos e arquiteturas heterogêneas.

  • A escolha do hardware certo para sua iniciativa de visão computacional depende de vários fatores. Neste artigo, encontre recomendações de hardware para três casos de uso principais na borda.

author-image

Por

O que é visão computacional?

Todas as organizações se esforçam para melhorar os negócios, a marca e os processos para obter um diferencial competitivo — desde proporcionar uma experiência excepcional ao cliente até eliminar os entraves da linha de produção. Mas não é humanamente possível identificar onde e quando essas melhorias são necessárias. A tecnologia de visão computacional, um tipo de inteligência artificial (IA), está sendo usada pelas organizações para treinar computadores para monitorar suas empresas a partir de vários pontos de contato e entender as quantidades enormes de dados visuais coletados.

A IA de visão computacional integra uma variedade de elementos para possibilitar que os sistemas “interpretem” dados provenientes de câmeras e vídeos. Isso envolve a combinação de câmeras, processamento de borda, computação em nuvem, software e modelos de aprendizado profundo, utilizados para treinar o sistema a reconhecer características em imagens ou vídeos e realizar previsões com base nelas. Os tipos de modelos de visão computacional incluem:

  • Classificação de imagem para inspecionar uma imagem e atribuir a ela um rótulo de classe com base no conteúdo. Por exemplo, um modelo de qualificação de imagem pode ser usado para prever quais imagens contêm um cachorro, um gato ou um cliente irritado.
  • Segmentação de imagem para identificar objetos e extraí-los de seu plano de fundo, como isolar um tumor do tecido cerebral circundante em resultados de radiografias.
  • Detecção de objetos para digitalizar imagens ou vídeos e encontrar objetos alvo. Os modelos de detecção de objetos geralmente destacam vários objetos simultaneamente e podem ser usados para tarefas como identificar itens nas prateleiras para melhorar o gerenciamento de estoque ou anomalias em itens em uma linha de produção.
  • Extração de recursos para isolar características úteis capturadas em uma imagem ou vídeo e compartilhá-las com um segundo algoritmo de IA, como pesquisa e recuperação de correspondência de imagens. Por exemplo, a extração de recursos pode ser usada para automatizar o monitoramento de tráfego e a detecção de incidentes.

A visão computacional está possibilitando uma série de novos casos de uso, ajudando empresas de todos os setores a reduzir os custos operacionais, desbloquear a automação empresarial e criar novos serviços ou fluxos de receita. Estes são apenas alguns exemplos:

  • Imagens médicas: a GE Healthcare lançou um aplicativo que usa algoritmos de IA de visão computacional para detectar descobertas críticas em radiografias de tórax, incluindo uma condição pulmonar com risco de vida chamada pneumotórax.
  • Soluções inteligentes para lojas de varejo: câmeras inteligentes que monitoram as prateleiras em lojas de varejo podem rastrear dados de estoque e notificar instantaneamente a equipe quando um item estiver faltando no estoque. A visão computacional integrada à sinalização digital permite que os varejistas avaliem quais tipos de clientes visualizaram quais mensagens de marketing, permitindo que as lojas melhorem a eficácia da sinalização na loja. A cadeia de supermercados Town Talk Foods usou análises de vídeo de IA para otimizar o marketing, as operações e a publicidade, permitindo que eles alcançassem sua meta anual de vendas 17% mais rapidamente.1
  • Rastreamento de movimentos atléticos: a Intel criou uma plataforma de IA que verifica vídeos de atletas feitos em telefones celulares e extrai informações importantes sobre a forma e o movimento de um atleta, ajudando atletas e treinadores a fazer os principais ajustes.

Identificando as tecnologias certas de hardware e software para aplicativos de visão computacional

Dados os benefícios transformadores da visão computacional, muitas organizações estão buscando aproveitar essa tecnologia em várias unidades da empresa. A adoção de soluções de visão computacional requer treinamento ou ajuste fino de modelos de IA de visão computacional — alimentando-os com dados para permitir recursos avançados — bem como implantar a carga de trabalho de visão de IA onde quer que seja necessário.

Por fim, permitir uma solução de visão computacional impactante, econômica e escalável requer a combinação certa de ferramentas de hardware e software de IA, selecionadas criteriosamente com base nos requisitos empresariais e de tecnologia. Vamos examinar como você pode usar o portfólio Intel® para atender às necessidades de praticamente qualquer caso de uso de visão computacional, e, ao mesmo tempo, atender aos seus requisitos de negócios.

Acelerando o desenvolvimento e a ciência de dados com ferramentas e otimizações Intel®

A implantação de visão computacional pode implicar um aumento considerável de desenvolvedores e cientistas de dados. Para simplificar o desenvolvimento e a implantação de modelos e otimizar o desempenho, a Intel oferece software de pipeline de IA de ponta a ponta, incluindo otimizações para estruturas populares, como TensorFlow, PyTorch e scikit-learn.

Além disso, oferecemos um portfólio de recursos para desenvolvedores para simplificar drasticamente a implantação, incluindo a Distribuição Intel® do kit de ferramentas OpenVINO™, o que permite que sua equipe escreva o código da solução de IA uma vez e depois o implante em praticamente qualquer lugar. Como uma estrutura de código aberto, o OpenVINO™ permite evitar a dependência de fornecedores e criar aplicativos que podem escalar perfeitamente em hardware heterogêneo, da borda à nuvem.

Para facilitar ainda mais a obtenção de valor mais rápido, estamos também sendo pioneiros com o Intel® Geti™, uma plataforma de visão computacional de nível empresarial de código aberto, que permite que especialistas em domínio não codificador colaborem com cientistas de dados para criar e treinar rapidamente modelos de IA.

Combinadas com nosso amplo portfólio de hardware, as ferramentas de software aberto da Intel podem simplificar a jornada da IA, do conceito à produção, garantindo o desempenho que você precisa e acelerando o ROI. A potência de uma plataforma de visão computacional combinada da Intel® AI permite que você aborde todos os aspectos do pipeline de IA com confiança.

Clique aqui para explorar todo o nosso portfólio de ferramentas de ciência de dados e desenvolvedores.

Treinamento e implantação de modelo: como escolher o hardware otimizado para suas necessidades

Como existem aplicativos de visão computacional diversificados, as necessidades de infraestrutura variam muito com base no problema que você está tentando resolver, onde os dados são treinados e analisados e no tamanho da carga de trabalho. Nesta seção, compartilhamos três questões principais a serem consideradas ao selecionar o melhor hardware para seus casos de uso.

Consideração 1: onde ocorrerá o treinamento do modelo de visão computacional?

Para identificar o hardware ideal para sua carga de trabalho de treinamento, considere primeiro se sua estratégia de IA e seu caso de uso exigem treinamento de modelos ou recursos de ajuste fino na borda, na nuvem e no data center, ou ambos. As restrições de custo ou de segurança podem impedir o treinamento de dados na nuvem. Além disso, pode ser possível aproveitar os ciclos fora de pico disponíveis em seus servidores de borda, permitindo que o treinamento ocorra onde os dados são gerados.

Para treinamento leve na borda, como modelos de ajuste fino, recomendamos um processador escalável Intel® Xeon® de classe de servidor com Intel® Data Center GPUs.

Para treinar ou implantar grandes conjuntos de dados, ou se for necessário treinar modelos rapidamente na borda, sua carga de trabalho pode exigir infraestrutura adicional ou treinamento e inferência baseados em nuvem. Recomendamos considerar um modelo de treinamento distribuído ao emparelhar cargas de trabalho de IA com servidores locais. A utilização dos processadores escaláveis Intel® Xeon® com aceleração de IA integrada pode proporcionar um treinamento eficiente e econômico sem a dependência de uma GPU.

Para cargas de trabalho muito grandes, você também pode adotar uma abordagem avançada de acelerador de aprendizado profundo usando Habana® Gaudi® ou GPUs de data center dedicadas, como a Intel® Data Center GPU Flex 140 ou 170.

Por exemplo, os aplicativos Mobileye em veículos autônomos usam a visão computacional para detectar e reagir a pedestres, outros veículos e sinais de trânsito. Para fazer isso, os aplicativos precisam processar centenas de imagens por segundo e executar modelos massivos continuamente, tornando o treinamento um fator importante para os custos operacionais. Para aumentar a eficiência do treinamento, a Mobileye usou o Habana® Gaudi® para treinar modelos na nuvem, melhorando o desempenho de preços em até 40%2.

Para obter informações sobre o treinamento de modelos, comece aqui:

Consideração 2: você precisa de um fator de forma robusto para a implantação?

Outra consideração crítica ao selecionar o hardware para sua solução de visão computacional é se você está implantando em um ambiente de TI tradicional ou em um local com desafios ambientais exclusivos. Ambientes exigentes, como pisos de fábrica industriais, armazéns, torres de celular ou embarcações, exigem dispositivos robustos, que sejam protegidos contra poeira, vibração, temperaturas prolongadas e outras condições adversas. A Intel oferece uma série de processadores de IoT e embarcados com GPUs integradas para dispositivos robustos e de fator de forma pequeno, bem como CPUs de servidor de propósito geral para ambientes padrão e cargas de trabalho que exigem mais rendimento.

Consideração 3: durante a operação, você precisa analisar e processar dados de vídeo na borda?

Se for necessário processar um grande volume de dados de imagem ou vídeo, pode ser muito caro carregar os dados para a nuvem, ou os requisitos regulamentares ou de segurança podem impedir o envio de dados para a nuvem. Você também pode estar enfrentando requisitos de latência que proíbem o processamento em nuvem. Além disso, você pode precisar que seu modelo continue o processamento na borda quando a nuvem estiver inacessível ou pode precisar que seu modelo analise os dados e reaja rapidamente.

Se a sua iniciativa exigir que o processamento de borda atenda a qualquer um desses problemas, provavelmente será necessário um desses três tipos de soluções: um dispositivo de borda integrado ou um dispositivo de IoT geral, uma caixa de IA de vídeo de dispositivo de borda ou um servidor de IA de vídeo de borda local.

Caso de uso: dispositivo de borda integrado ou dispositivo de IoT geral para implantações de baixa latência

A tecnologia de visão computacional é comumente incorporada em dispositivos de borda ou IoT, como drones, braços de robôs ou câmeras inteligentes. Essas implantações são autônomas, com restrições de espaço ou de consumo de energia, ou exigem a menor latência de IA possível. A Intel oferece produtos específicos e de baixo consumo de energia que atendem aos diversos requisitos e restrições de dispositivos de borda e embarcados.

Dependendo da complexidade de suas cargas de trabalho, considere uma das seguintes combinações de hardware:

Leia como um aplicativo de visão computacional construído com hardware Intel® auxiliou a Signify, fabricante de iluminação, a simplificar o controle de qualidade na linha de produtos.

Caso de uso: caixa de IA de vídeo de dispositivo de borda para implantações de média complexidade

As implantações de caixas de vídeo de IA de dispositivo de borda apresentam um pequeno número de câmeras (cerca de 4 a 10), diretamente conectadas ou transmitidas para um único aplicativo para processamento de IA integrado. Por exemplo, aplicativos de visão computacional em estações de autoentendimento de varejo usam vários sensores para identificar quais produtos um cliente está comprando, permitindo que os clientes realizem transações mais rápidas e auxiliando as lojas a evitar roubo. Como exigem menos fluxos de câmera, essas implantações podem ser efetivamente suportadas usando processadores de baixo consumo de energia.

Se você precisar proteger contra poeira, graxa ou outros contaminantes em seu ambiente, recomendamos hardware semirrobusto ou totalmente robusto, com resfriamento passivo ou externo em vez de um ventilador de chassis aberto.

Para cargas de trabalho de complexidade pequena a média e implantação em qualquer ambiente:

  • Processadores Intel® Core™ com recursos de aceleração integrados, como Intel® Gaussian e Neural Accelerator (Intel® GNA) para um acelerador de consumo de energia ultrabaixo e GPUs integradas.

Para cargas de trabalho de média a grande complexidade e implantação em ambientes de TI padrão e ambientes que exigem um design semirrobusto, considere as seguintes opções adicionais:

Leia mais sobre como as soluções de visão computacional Intel® estão auxiliando os varejistas a converter dados em informações em tempo real.

Caso de uso: servidor de IA de vídeo de borda no local para implantações avançadas

Para alguns casos de uso avançados, como um aplicativo de imagens médicas que aplica algoritmos de IA de visão computacional para detectar doenças em resultados de radiografias, sua implantação pode apresentar muitas câmeras remotas — às vezes 300 ou mais — que transmitem para um único dispositivo local para processamento de IA. Como essas implantações podem suportar muitas câmeras e executar vários modelos de visão computacional, talvez seja necessário considerar o hardware que proporcione uma potência de processamento significativa.

Você também precisará considerar as condições ambientais. Se o servidor de IA de vídeo estiver localizado em um ambiente de TI padrão, você pode escolher o hardware adequado para um servidor de data center padrão ou uma estação de trabalho empresarial. No entanto, para ambientes com condições adversas, você precisará de um servidor modular robusto.

Para a implantação em um ambiente de TI padrão, dependendo da sua carga de trabalho, considere:

Quando a implantação exigir um design robusto, dependendo da sua carga de trabalho, considere:

Leia como a solução de automação de restaurantes baseada em visão computacional da Hellometer está ajudando as marcas a melhorar a experiência de drive-through. Usando os processadores para dispositivos móveis Intel® Core™ com aceleração de IA integrada e software OpenVINO™, o Hellometer permite que os operadores de restaurantes melhorem a velocidade do serviço em 47 segundos em média, equivalendo a uma receita adicional estimada de US$ 130 mil por ano por local3.

Construindo um aplicativo de visão computacional preparado para o futuro com as soluções Intel® Vision

A Intel oferece um amplo portfólio de hardware e ferramentas de software de desenvolvimento de IA de ponta a ponta que podem ajudá-lo a criar um aplicativo de visão computacional com o equilíbrio certo entre desempenho e custo. As diversas opções de hardware oferecem a potência de processamento necessária para implantar a visão computacional em qualquer ambiente. O melhor de tudo é que desenvolvedores e cientistas de dados podem usar nossas ferramentas de software de código aberto, como a Distribuição Intel® do kit de ferramentas OpenVINO™, para desenvolver e otimizar aplicativos que escalam facilmente em dispositivos heterogêneos. Ao alterar algumas linhas de código, você pode equipar um modelo de IA de visão computacional treinado em milhares de aceleradores de aprendizado profundo para ser executado em um drone.

Encontre soluções Intel® que podem potencializar a IA em todas as etapas da jornada, em qualquer escala.

Explore o portfólio Intel® Vision para soluções de visão computacional

Perguntas frequentes

Perguntas frequentes

A visão computacional é um tipo de IA que permite que os computadores “vejam” dados coletados de imagens e vídeos. Usando aplicativos de visão computacional, as organizações podem monitorar aspectos de seus negócios e treinar computadores para responder ao que veem, automatizando partes da empresa de maneiras que não eram possíveis anteriormente.

A visão computacional combina câmeras, computação de borda, software e IA para permitir que os sistemas realizem tarefas como a qualificação de imagem e a detecção de objetos. Os aplicativos de visão computacional usam aprendizado profundo para ensinar um computador a reconhecer aspectos de uma imagem ou vídeo e fazer previsões sobre eles.