O Intel® Data Center Diagnostic Tool é uma ferramenta para verificar a integridade dos núcleos da CPU.
A versão atual tem 639 anos e foi lançada em 26 de março de 2025.
Um dos principais provedores de nuvem e data centers corporativos de hiperescala sempre foi fornecer o melhor tempo de atividade e confiabilidade possíveis. Historicamente, o setor tem feito muito bem, alcançando rotineiramente >99,999% de tempo de atividade. No entanto, a infraestrutura de computação moderna traz expectativas de usuário cada vez maiores para a qualidade do serviço (QoS) e a alta disponibilidade. Essas expectativas enfatizam a necessidade de ferramentas de software poderosas que podem ajudar a identificar e minimizar falhas inesperadas do sistema que podem comprometer o QoS ou o tempo de atividade.
Na Intel, construímos e empregamos ferramentas avançadas de teste e validação de nível de componentes que reduzem significativamente defeitos em nossos produtos que podem resultar em erros do sistema. Nossos clientes de hiperescala e seus fornecedores usam essas mesmas ferramentas de software desenvolvidas pela Intel para manter a saúde da frota ao longo da vida de seus sistemas. Eles reconhecem que, ao longo do tempo, o monitoramento próximo dos ativos do sistema pode melhorar a resiliência geral da frota e o QoS do cliente.
A Intel reconhece que muitos clientes diferentes podem se beneficiar dos mesmos recursos, e o Intel® Data Center Diagnostic Tool é uma versão simplificada deste software para gerenciar ambientes locais.
A Intel® Data Center Diagnostic Tool (Intel® DCDiag) foi desenvolvida para que gerentes de TI conduzam manutenção periódica de suas frotas de data centers. O Intel® DCDiag pode ser usado em qualquer tamanho do data center para ajudar a garantir o mais alto nível de qualidade e disponibilidade contínuos. Além disso, o DCDiag pode ser usado para triagem periódica da frota em primeiro plano (~45 minutos de tempo de execução) ou em modo de segundo plano e pode identificar microprocessadores defeituosos. A execução da manutenção periódica do sistema ajuda a identificar problemas potenciais de forma proativa e dá aos administradores do sistema a capacidade de substituir esses microprocessadores.
O Intel® DCDiag é um conjunto de testes que verifica metodicamente a maioria das funcionalidades do SoC, incluindo o de cada núcleo de microprocessador individual. Ao verificar se cada computação do DCDiag está correta, e não apenas confirmando que o teste foi concluído corretamente, o DCDiag é capaz de detectar muitos tipos de falhas, incluindo aquelas que se manifestam como Erros de Dados Silenciosos.
O Intel® DCDiag encontra falhas verificando os resultados corretos das operações do processador com vários testes.
Conjuntos de dados aleatórios são usados para testar instruções e núcleos. O relatório foi aprovado ou reprovado fácil de entender em um processador. Os processadores que falharem no teste devem ser devolvidos ao fornecedor do sistema ou ao distribuidor para substituição.
Os resultados dos testes do DCDiag foram projetados para ser fáceis de entender. Quando o diagnóstico for concluído, o sistema retorna uma das seguintes mensagens:
Verifique o modelo e a versão do processador do sistema. Esta mensagem aparece se o Intel Data Center Diagnostic Tool não detectar uma versão de produção dos processadores suportados. Amostras de engenharia não são suportadas por esta ferramenta.
Encontre ajuda para identificar o processador.
A versão mais recente do microcódigo soluciona problemas conhecidos. A Intel recomenda a atualização para a versão mais recente.
Se os resultados dos testes apresentarem falha, verifique se os processadores do seu nó de servidor ainda estão na garantia.
Se você tiver um processador Intel® Xeon® in a box ainda sob uma garantia de 3 anos, entre em contato com Intel Customer Support para obter assistência.
Se você tiver um processador de bandeja, entre em contato com o fornecedor do seu sistema ou processador ou com o local de compra para obter assistência.
O Intel® Data Center Diagnostic Tool é um aplicativo disponível para sistemas operacionais Linux* e Windows*. A ferramenta pode ser instalada e executada em muitas distribuições atuais do Linux* e do Windows*, consulte Instalação no Linux* e Windows*.
A partir da versão 558, a ferramenta pode ser instalada no Windows* usando o instalador MSI fornecido e executada em qualquer versão do Windows® 10, Windows* Server 2016 ou mais recente compatível com a Microsoft. Consulte as informações de versão do Windows* Server para determinar quais versões de sistemas Windows* Server estão disponíveis e são suportadas no momento.
Para melhor cobertura, execute o aplicativo no sistema raiz de um servidor. É possível executá-la dentro de um contêiner ou máquina virtual, mas esteja ciente de que algumas funcionalidades podem estar desativadas.
Além disso, a Intel introduziu um novo recurso de confiabilidade, disponibilidade e capacidade de serviço (RAS) chamado Varredura em campo da Intel®. Esta é uma família de ferramentas projetada para ajudar os administradores de sistemas a encontrar com rapidez e facilidade os processadores que falharam ao longo do tempo. Para obter mais informações sobre a Varredura in-Field da Intel, acesse este link.
A Varredura em Campo da Intel® e o Intel® DCDiag são ferramentas de teste complementares. A Varredura em campo da Intel® é mínimamente intrusiva e projetada para testar rapidamente um núcleo, enquanto todos os outros núcleos no nó continuam a executar cargas de trabalho do cliente. O Intel® DCDiag é um conjunto abrangente de testes de processadores e é mais eficaz quando todo o nó de processamento é dedicado a testes. Como as ferramentas executam conteúdo de teste diferente, a Intel descobriu que cada ferramenta identifica diferentes falhas em todos os processadores testados.
Nota: Para desenvolvedores: a Intel iniciou o projeto de diagnóstico de data center aberto, que abre a estrutura de diagnóstico de data center da Intel e fornece testes selecionados. Isso oferece aos desenvolvedores uma estrutura de desenvolvimento de testes consistente que convida a criatividade da comunidade de código aberto a aprimorar o gerenciamento de frotas de nuvem através do desenvolvimento de telas de teste exclusivas e de outras soluções inovadoras. Para obter mais informações, verifique este framework e testes.
Data | Versão | Descrição |
07 de julho de 2021 | 540 | Versão inicial |
16 de agosto de 2022 | 549 | Correção de bugs |
20 de setembro de 2022 | 549 | Comando alterado para habilitar a ferramenta e verificar a habilitação |
10 de janeiro de 2023 | 550 | Inclua processadores Intel® Xeon® da 4ª Geração |
20 de janeiro de 2023 | 576 | Versão 576 da versão |
14 de dezembro de 2023 | 594 | Versão 594 |
22 de março de 2024 | 603 | Versão 603 da versão |
22 de abril de 2024 | 605 | Versão 605 da versão |
21 de junho de 2024 | 612 | Versão 612 da versão |
22 de julho de 2024 | 613 | Versão 613 do Hotfix |
20 de setembro de 2024 | 621 | Versão 621 da versão |
12 de dezembro de 2024 | 630 | Versão 630 da versão |
26 de março de 2025 | 639 | Versão 639 da versão |