Descentralizando a inferência de IA gerativa (GenAI) no dispositivo — publicação técnica

Fazer download

Em coleções:

ID 850477

Data 2025-03-25

Public

Descrição

Aproximar a inferência da IA da fonte de dados oferece vantagens significativas em custo, privacidade e desempenho. Os avanços recentes em modelos GenAI leves (por exemplo, parâmetros de 1-8B) oferecem uma oportunidade disruptiva para mudar a implantação de GenAI da nuvem para a borda, mas as alternativas para a GenAI baseada em nuvem precisam ser práticas e eficientes. Esta publicação técnica descreve uma abordagem estratégica para transferir implantações genAI de soluções nativas em nuvem (ou seja, baseadas em GPU) para soluções de borda (por exemplo, baseadas em hardware) usando a aceleração de computação integrada de CPU-GPU-NPU (por exemplo, processadores Intel® Core™ Ultra Intel® Arc™ GPUs) e modelos GenAI de código aberto. A implantação no dispositivo oferece baixo custo total de propriedade (TCO), capacidades off-line, soberania dos dados e latência reduzida, tornando os poderosos modelos GenAI acessíveis entre regiões e setores que podem ter enfrentado barreiras para a implantação.

Selecione o seu idioma

Usando a pesquisa Intel.com

Links rápidos

Pesquisas recentes

Busca avançada

Pesquisar apenas em

Descentralizando a inferência de IA gerativa (GenAI) no dispositivo — publicação técnica

Descrição

Instruções de uso