Operações de inferência de IA gerativas com processadores Cisco UCS / 5ª Geração e 4ª Geração Intel Xeon
Data Center Content Library Intel® Xeon® Scalable Processors Intel® Xeon® Scalable Processors Intel® Xeon® Scalable Processors Intel® QuickAssist Technology (Intel® QAT)
812502
2023-12-29
Public
A preview is not available for this record, please engage by choosing from the available options ‘download’ or ‘view’ to engage with the material
Descrição
O Cisco UCS, com tecnologia dos processadores Intel® Xeon® da 5ª Geração e do Cisco Nexus, é uma base escalável para a implantação de IA gerativa em escala. Essa arquitetura oferece:
- Desempenho ideal: O Cisco UCS com processadores escaláveis Intel Xeon com aceleradores de IA especializados e estruturas de software otimizadas melhora significativamente o desempenho e a escalabilidade da inferência.
- Arquitetura equilibrada: O Cisco UCS se destaca em aprendizagem profunda e computação não-profunda, fundamentais para todo o fluxo de inferência. Essa abordagem equilibrada leva a um melhor desempenho geral e utilização de recursos.
- Escalabilidade sob demanda: O Cisco UCS escala facilmente com suas necessidades de inferência de IA gerativa. Adicione ou remova servidores, ajuste as capacidades da memória e configure os recursos de forma automatizada à medida que seus modelos evoluem e as cargas de trabalho crescem usando o Cisco Intersight.
Você tem a opção de executar inferências no data center ou na borda, usando um formato modular ou em rack.
Instruções de uso
Ativos relacionados
Título e descrição
Formato
Idioma
Ação
Cisco UCS M7 and Pure Storage FlashArray: FlashStack VSI with VMware vSphere 8.0 — Design Guide
Cisco 7th generation of UCS C-Series and UCS X-Series Servers, powered using 4th Gen Intel Xeon Scalable processors., and Pure Storage FlashArray FlashStack on VMware vSphere 8 solution.
Cisco UCS M7 IMM FlexPod Datacenter with VMware vSphere 8.0, and NetApp ONTAP 9.12 Powered by Intel — Design Guide
Cisco UCS M7 IMM FlexPod Datacenter with VMware vSphere 8.0, and NetApp ONTAP 9.12 powered by Intel design guide
FlashStack Cisco UCS X-Series and Pure Storage FlashArray//X R3 for VMware Horizon 8 — Design Guide
FlashStack Virtual Desktop Infrastructure for VMware Horizon 8 VMware vSphere 8.0 U1 and 4th Gen Intel® Xeon® Scalable processors Design Guide
Cisco UCS with 5th Gen and 4th Gen Intel Xeon Processors for Generative AI
Cisco UCS, powered by 5th Gen Intel® Xeon® processors, delivers a compelling solution for maximizing Generative AI performance.
Generative AI Inferencing with Cisco UCS X-Series M7 Blade Servers / 5th Gen Intel Xeon Processors
Cisco UCS® with Intel® Xeon® Scalable processors and Cisco Nexus® offers a compelling and scalable foundation for deploying generative AI at scale.
GenAI Inferencing Powered by Cisco UCS X-Series / 5th Gen Intel Xeon Processors on Red Hat OpenShift AI — Cisco Validated Design
Cisco, Red Hat, and Intel provide a proven AI infrastructure to enable VMware-based Red Hat® OpenShift® AI.
Microsoft SQL Server 2022 on Cisco UCS X210c M6/M7 on 4th Gen Intel® Xeon® Scalable Processors — White Paper
This white paper contains a reference architecture that illustrates the benefits of Microsoft SQL Server 2022 on Cisco UCS X210c M6/M7 on 4th Gen Intel® Xeon® Scalable Processors for bare-metal and hybrid cloud deployments.