Ir para o conteúdo principal
Base de conhecimentos do Suporte

Intel® Data Center Diagnostic Tool de processadores Intel® Xeon®

Tipo de conteúdo: Manutenção e desempenho   |   ID do artigo: 000058107   |   Última revisão: 26/03/2025

Ambiente

processadores Intel® Xeon®

Visão geral do produto

O Intel® Data Center Diagnostic Tool é uma ferramenta para verificar a integridade dos núcleos da CPU.

A versão atual tem 639 anos e foi lançada em 26 de março de 2025.

Ambiente

Um dos principais provedores de nuvem e data centers corporativos de hiperescala sempre foi fornecer o melhor tempo de atividade e confiabilidade possíveis. Historicamente, o setor tem feito muito bem, alcançando rotineiramente >99,999% de tempo de atividade. No entanto, a infraestrutura de computação moderna traz expectativas de usuário cada vez maiores para a qualidade do serviço (QoS) e a alta disponibilidade. Essas expectativas enfatizam a necessidade de ferramentas de software poderosas que podem ajudar a identificar e minimizar falhas inesperadas do sistema que podem comprometer o QoS ou o tempo de atividade.

Na Intel, construímos e empregamos ferramentas avançadas de teste e validação de nível de componentes que reduzem significativamente defeitos em nossos produtos que podem resultar em erros do sistema. Nossos clientes de hiperescala e seus fornecedores usam essas mesmas ferramentas de software desenvolvidas pela Intel para manter a saúde da frota ao longo da vida de seus sistemas. Eles reconhecem que, ao longo do tempo, o monitoramento próximo dos ativos do sistema pode melhorar a resiliência geral da frota e o QoS do cliente.

A Intel reconhece que muitos clientes diferentes podem se beneficiar dos mesmos recursos, e o Intel® Data Center Diagnostic Tool é uma versão simplificada deste software para gerenciar ambientes locais.

Ferramenta de diagnóstico para data center da Intel®

A Intel® Data Center Diagnostic Tool (Intel® DCDiag) foi desenvolvida para que gerentes de TI conduzam manutenção periódica de suas frotas de data centers. O Intel® DCDiag pode ser usado em qualquer tamanho do data center para ajudar a garantir o mais alto nível de qualidade e disponibilidade contínuos. Além disso, o DCDiag pode ser usado para triagem periódica da frota em primeiro plano (~45 minutos de tempo de execução) ou em modo de segundo plano e pode identificar microprocessadores defeituosos. A execução da manutenção periódica do sistema ajuda a identificar problemas potenciais de forma proativa e dá aos administradores do sistema a capacidade de substituir esses microprocessadores.

O Intel® DCDiag é um conjunto de testes que verifica metodicamente a maioria das funcionalidades do SoC, incluindo o de cada núcleo de microprocessador individual. Ao verificar se cada computação do DCDiag está correta, e não apenas confirmando que o teste foi concluído corretamente, o DCDiag é capaz de detectar muitos tipos de falhas, incluindo aquelas que se manifestam como Erros de Dados Silenciosos.

O Intel® DCDiag encontra falhas verificando os resultados corretos das operações do processador com vários testes.

  • Executa vários loops de código ou executa o mesmo código em todos os núcleos e verifica se os resultados são os mesmos.
  • Verifica caches, comunicações core-a-core e a maioria das instruções do processador.

Conjuntos de dados aleatórios são usados para testar instruções e núcleos. O relatório foi aprovado ou reprovado fácil de entender em um processador. Os processadores que falharem no teste devem ser devolvidos ao fornecedor do sistema ou ao distribuidor para substituição.

How Does DCDIAG Work?

Resultados dos testes

Os resultados dos testes do DCDiag foram projetados para ser fáceis de entender. Quando o diagnóstico for concluído, o sistema retorna uma das seguintes mensagens:

  • Teste concluído com sucesso. Nenhum problema detectado.
  • Teste concluído com sucesso. Ocorreu um ou mais erros de verificação da máquina. Verifique os logs do sistema.
  • Este processador não é compatível com esta versão da ferramenta.
    • Verifique o modelo e a versão do processador do sistema. Esta mensagem aparece se o Intel Data Center Diagnostic Tool não detectar uma versão de produção dos processadores suportados. Amostras de engenharia não são suportadas por esta ferramenta.

    • Encontre ajuda para identificar o processador.

  • Teste concluído. Os resultados são inconclusivos devido a uma versão desatualizada do microcódigo.
    • A versão mais recente do microcódigo soluciona problemas conhecidos. A Intel recomenda a atualização para a versão mais recente.

  • O teste falhou. Para obter suporte, entre em contato com o fabricante do seu sistema ou com o fornecedor do processador.
    • Se os resultados dos testes apresentarem falha, verifique se os processadores do seu nó de servidor ainda estão na garantia.

    • Se você tiver um processador Intel® Xeon® in a box ainda sob uma garantia de 3 anos, entre em contato com Intel Customer Support para obter assistência.

    • Se você tiver um processador de bandeja, entre em contato com o fornecedor do seu sistema ou processador ou com o local de compra para obter assistência.

Requisitos do sistema

O Intel® Data Center Diagnostic Tool é um aplicativo disponível para sistemas operacionais Linux* e Windows*. A ferramenta pode ser instalada e executada em muitas distribuições atuais do Linux* e do Windows*, consulte Instalação no Linux* e Windows*.

A partir da versão 558, a ferramenta pode ser instalada no Windows* usando o instalador MSI fornecido e executada em qualquer versão do Windows® 10, Windows* Server 2016 ou mais recente compatível com a Microsoft. Consulte as informações de versão do Windows* Server para determinar quais versões de sistemas Windows* Server estão disponíveis e são suportadas no momento.

Para melhor cobertura, execute o aplicativo no sistema raiz de um servidor. É possível executá-la dentro de um contêiner ou máquina virtual, mas esteja ciente de que algumas funcionalidades podem estar desativadas.

Processadores suportados:

  • Intel® Xeon® 6 (codinome anterior: Sierra Forest e Granite Rapids)
  • Processadores escaláveis Intel® Xeon® da 5ª Geração (codinome anterior Emerald Rapids)
  • Processadores escaláveis Intel® Xeon® da 4ª Geração (codinome anterior Sapphire Rapids)
  • Intel® Xeon® CPU série Max (codinome anterior Sapphire Rapids HBM)
  • Processadores escaláveis Intel® Xeon® da 3ª Geração (codinome anterior: Ice Lake e Cooper Lake)
  • Processadores escaláveis Intel® Xeon® da 2ª Geração (codinome anterior Cascade Lake)
  • Processadores escaláveis Intel® Xeon® da 1ª Geração (codinome anterior: Skylake)
  • Família de processadores Intel® Xeon® E5 v4 (codinome anterior: Broadwell)
  • Família de processadores Intel® Xeon® E7 v4 (codinome anterior: Broadwell)

Além disso, a Intel introduziu um novo recurso de confiabilidade, disponibilidade e capacidade de serviço (RAS) chamado Varredura em campo da Intel®. Esta é uma família de ferramentas projetada para ajudar os administradores de sistemas a encontrar com rapidez e facilidade os processadores que falharam ao longo do tempo. Para obter mais informações sobre a Varredura in-Field da Intel, acesse este link.

A Varredura em Campo da Intel® e o Intel® DCDiag são ferramentas de teste complementares. A Varredura em campo da Intel® é mínimamente intrusiva e projetada para testar rapidamente um núcleo, enquanto todos os outros núcleos no nó continuam a executar cargas de trabalho do cliente. O Intel® DCDiag é um conjunto abrangente de testes de processadores e é mais eficaz quando todo o nó de processamento é dedicado a testes. Como as ferramentas executam conteúdo de teste diferente, a Intel descobriu que cada ferramenta identifica diferentes falhas em todos os processadores testados.

Nota: Para desenvolvedores: a Intel iniciou o projeto de diagnóstico de data center aberto, que abre a estrutura de diagnóstico de data center da Intel e fornece testes selecionados. Isso oferece aos desenvolvedores uma estrutura de desenvolvimento de testes consistente que convida a criatividade da comunidade de código aberto a aprimorar o gerenciamento de frotas de nuvem através do desenvolvimento de telas de teste exclusivas e de outras soluções inovadoras. Para obter mais informações, verifique este framework e testes.

Histórico de versões

Data Versão Descrição
07 de julho de 2021 540 Versão inicial
16 de agosto de 2022 549 Correção de bugs
20 de setembro de 2022 549 Comando alterado para habilitar a ferramenta e verificar a habilitação
10 de janeiro de 2023 550 Inclua processadores Intel® Xeon® da 4ª Geração
20 de janeiro de 2023 576 Versão 576 da versão
14 de dezembro de 2023 594 Versão 594
22 de março de 2024 603 Versão 603 da versão
22 de abril de 2024 605 Versão 605 da versão
21 de junho de 2024 612 Versão 612 da versão
22 de julho de 2024 613 Versão 613 do Hotfix
20 de setembro de 2024 621 Versão 621 da versão
12 de dezembro de 2024 630 Versão 630 da versão
26 de março de 2025 639 Versão 639 da versão

Avisos legais

O conteúdo desta página é uma combinação de tradução humana e por computador do conteúdo original em inglês. Este conteúdo é fornecido para sua conveniência e apenas para informação geral, e não deve ser considerado completo ou exato. Se houver alguma contradição entre a versão em inglês desta página e a tradução, a versão em inglês prevalecerá e será a determinante. Exibir a versão em inglês desta página.