Profissional Certificado pela NVIDIA

Infraestrutura de IA

(NCP-AII)

Sobre Esta Certificação

A certificação NCP-AI Infrastructure é uma credencial de nível intermediário que valida a capacidade do candidato de implantar, configurar e validar a infraestrutura avançada de IA da NVIDIA. O exame é online e supervisionado remotamente, inclui aproximadamente 70 questões e tem um limite de tempo de 120 minutos.

Revise cuidadosamente nossas Perguntas Frequentes de certificação e políticas de exame antes de agendar seu exame.

Caso tenha alguma pergunta, fale conosco aqui.

Observação: para acessar o exame, você precisará criar uma conta no Certiverse.

Detalhes do Exame de Certificação

Duração: 120 minutos  

Preço: US$400 

Nível de certificação: Profissional  

Assunto: Infraestrutura de IA  

Número de perguntas: de 70 a 75

Pré-requisitos: dois a três anos de experiência operacional trabalhando em um data center com soluções de hardware da NVIDIA. O(A) candidato(a) deve conseguir implantar todas as partes de uma infraestrutura de data center para suporte a cargas de trabalho de IA.

Idioma: inglês 

Validade: essa certificação é válida por dois anos a partir da data de emissão. A recertificação pode ser obtida por meio de uma nova submissão ao exame.

Credenciais: após a aprovação no exame, os participantes receberão um selo digital e um certificado opcional indicando o nível de certificação e o tópico.

Preparação para o Exame

Assuntos Abordados no Exame

Os tópicos abordados no exame incluem:

  • Instalação e configuração de servidores e redes.
  • Gerenciamento da camada física.
  • Resolução de problemas e otimização de sistemas e redes.

Público-alvo

  • Administradores de data center.
  • Administradores de infraestrutura.
  • Administradores de rede
  • Engenheiros de rede
  • Administradores de armazenamento
  • Administradores de sistemas
  • Arquitetos de soluções

Treinamento Recomendado

Conceitos Básicos de Infraestrutura e Operações de IA.

Um curso autônomo que abrange os componentes essenciais da infraestrutura de IA, incluindo plataformas de computação, soluções de rede e armazenamento O curso também aborda operações de IA, com foco no gerenciamento de infraestrutura e na orquestração de clusters.

Workshop Profissional de Infraestrutura de IA

Um workshop de vários dias que aborda os aspectos essenciais da infraestrutura de IA em data centers modernos, com foco nas tecnologias de ponta da NVIDIA. O curso fornece um estudo profundo da otimização de cargas de trabalho de IA, no gerenciamento de recursos de GPU e no aproveitamento do ecossistema da NVIDIA para criar e manter data centers eficientes orientados por IA.

Guia de Estudo para o Exame

Conheça o Guia de Estudos

Roteiro do Exame

A tabela abaixo fornece uma visão geral das áreas contempladas no exame de certificação e quanto do exame está focado naquele assunto.

Áreas Temáticas % do Exame Tópicos Abordados
Configuração Inicial do Sistema e do Servidor 31%
  • Descrever a sequência de eventos para implantação e validação.
  • Descrever as topologias de rede para fábricas de IA.
  • Realizar a configuração inicial do BMC, OOB e TPM. 
  • Realizar atualizações de firmware (incluindo no HGX™) e detecção de falhas.
  • Validar os parâmetros de energia e resfriamento.
  • Instalar servidores baseados em GPU (SMI).
  • Validar o hardware instalado.
  • Descrever e validar tipos de cabos e transceptores.
  • Instalar GPUs físicas.
  • Validar a operação do hardware para cargas de trabalho.
  • Configurar os parâmetros iniciais para armazenamento de terceiros.
Gerenciamento da Camada Física 5%
  • Configurar e gerenciar uma plataforma de rede BlueField®.
  • Configurar o MIG (IA e HPC).
Instalação e Configuração do Plano de Controle 19%
  • Instalar o Base Command™ Manager (BCM), configurar e verificar o HA.
  • Instalar o SO.
  • Instalar o Cluster (configurar a categoria, configurar as interfaces, instalar o Slurm/Enroot/Pyxis).
  • Instalar/atualizar/remover os drivers da GPU NVIDIA e do DOCA™.
  • Instalar o kit de ferramentas de contêineres da NVIDIA.
  • Demonstrar como usar as GPUs da NVIDIA com o Docker.
  • Instalar o NGC™ CLI nos hosts.
Teste e Verificação do Cluster 33%
  • Realizar um teste de estresse em um único nó.
  • Executar o HPL (Linpack de Alto Desempenho).
  • Executar o NCCL de nó único (incluindo a verificação do NVLink™ Switch).
  • Validar os cabos, verificando a qualidade do sinal.
  • Confirmar que o cabeamento está correto.
  • Confirmar o FW/SW nos switches.
  • Confirmar o FW/SW no BlueField-3.
  • Confirmar o FW nos transceptores.
  • Executar o ClusterKit para realizar uma avaliação de nós multifacetada.
  • Executar o NCCL para verificar a largura de banda da malha E/W.
  • Realizar o burn-in no NCCL.
  • Realizar o burn-in no HPL.
  • Executar o burn-in do NeMo™.
  • Testar o armazenamento.
Resolução de Problemas e Otimização 12%
  • Identificar e solucionar problemas de hardware (por exemplo, GPU, ventoinha, placa de rede). 
  • Identificar cartões, GPUs e fontes de alimentação com defeito. 
  • Substituir placas, GPUs e fontes de alimentação com defeito. 
  • Executar a otimização de desempenho para servidores AMD e Intel. 
  • Otimizar o armazenamento.

Fale Conosco

A NVIDIA oferece treinamento e certificação para profissionais que desejam aprimorar suas habilidades e conhecimentos no campo da IA, computação acelerada, ciência de dados, redes avançadas, gráficos, simulação e muito mais.

Fale conosco para saber como podemos ajudar você a alcançar seus objetivos.

Mantenha-se em Dia

Receba notícias, anúncios e muito mais da NVIDIA, incluindo as informações mais recentes sobre novos treinamentos autoguiados, workshops conduzidos por instrutor(a), treinamento gratuito, descontos e muito mais. A inscrição pode ser cancelada a qualquer momento.