Otimização e execução do LLaMA2 na CPU Intel®

Fazer download

ID 791610

Data 2023-10-24

Public

Descrição

Nesta publicação técnica, demonstramos como é possível executar otimização específica da plataforma de hardware para melhorar a velocidade de inferência do seu modelo LLaMA2 LLM no llama.cpp (um software de inferência de modelo LLaMA de código aberto) executado na plataforma de CPU Intel®.

Selecione o seu idioma

Usando a pesquisa Intel.com

Links rápidos

Pesquisas recentes

Busca avançada

Pesquisar apenas em

Otimização e execução do LLaMA2 na CPU Intel®

Descrição

Instruções de uso