Profesional Certificado por NVIDIA

Infraestructura de IA

(NCP-AII)

Sobre Esta Certificación

La certificación NCP-AI Infrastructure es una credencial de nivel intermedio que valida la capacidad de un candidato para implementar, configurar y validar la infraestructura avanzada de IA de NVIDIA. El examen es en línea y se supervisa de forma remota, incluye aproximadamente 70 preguntas y tiene un límite de tiempo de 120 minutos.

Revise cuidadosamente nuestras preguntas frecuentes de certificación y políticas de exámenes antes de programar su examen.

Si tiene alguna pregunta, contáctenos aquí.

Tenga en cuenta que, para acceder al examen, deberá crear una cuenta de Certiverse.

Detalles del Examen de Certificación

Duración: 120 minutos  

Precio: $400 

Nivel de Certificación: Profesional  

Asunto: Infraestructura de IA  

Número de preguntas: 70-75

Requisitos previos: De dos a tres años de experiencia operativa trabajando en un data center con soluciones de hardware de NVIDIA. El candidato debe poder implementar todas las partes de una infraestructura de data center para respaldar cargas de trabajo de IA.

Idioma: Inglés 

Validez: Esta certificación es válida por dos años a partir de su emisión. Se puede conseguir la certificación de nuevo mediante una nueva presentación al examen.

Credenciales: Al aprobar el examen, los participantes recibirán una insignia digital y un certificado opcional que indica el nivel de certificación y el tema.

Preparación Para El Examen

Temas Que Cubre el Examen

Los temas cubiertos en el examen incluyen:

  • Instalar y configurar servidores y redes
  • Administración de capas físicas
  • Solucionar problemas y optimizar sistemas y redes

Audiencias Candidatas

  • Administradores de data center
  • Administradores de infraestructura
  • Administradores de redes
  • Ingenieros de redes
  • Administradores de almacenamiento
  • Administradores de sistemas
  • Arquitectos de soluciones

Entrenamiento Recomendado

Fundamentos de Infraestructura y Operaciones de IA

Un curso autogestionado que cubre componentes esenciales de la infraestructura de IA como plataformas de computación, redes y soluciones de almacenamiento. El curso también aborda operaciones de IA, centrándose en la administración de infraestructura y la orquestación de clústeres.

Taller de Infraestructura Profesional de IA

Un taller de varios días que cubre los aspectos esenciales de la infraestructura de IA en los data centers modernos, focalizado en las tecnologías de vanguardia de NVIDIA. El curso proporciona una inmersión profunda en la optimización de las cargas de trabajo de IA, la administración de recursos de GPU y el aprovechamiento del ecosistema de NVIDIA para desarrollar y mantener data centers eficientes impulsados por IA.

Guía de Estudio Del Examen

Explore la Guía de Estudio

Esquema del Examen

La siguiente tabla proporciona una descripción general de las áreas temáticas cubiertas en el examen de certificación y cuánto del examen se centra en ese tema.

Áreas Temáticas % del Examen Temas Abarcados
Inicialización del Sistema y del Servidor 31%
  • Describa la secuencia de eventos para la implementación y la validación.
  • Describa topologías de red para fábricas de IA.
  • Realice la configuración inicial de BMC, OOB y TPM. 
  • Realice actualizaciones de firmware (incluso en HGX™) y detecte fallas.
  • Valide los parámetros de alimentación y refrigeración.
  • Instale servidores basados en GPU (SMI).
  • Valide el hardware instalado.
  • Describa y valide los tipos de cables y transceptores.
  • Instale GPU físicas.
  • Valide la operación de hardware para cargas de trabajo.
  • Configure parámetros iniciales para el almacenamiento tercerizado.
Administración de Capas Físicas 5%
  • Configure y administre una plataforma de red BlueField®.
  • Configure MIG (IA y HPC).
Instalación y Configuración de Plano de Control 19%
  • Instale Base Command™ Manager (BCM), configure y verifique la HA.
  • Instale el OS.
  • Instale el clúster (configurar la categoría, configurar interfaces, instalar Slurm/Enroot/Pyxis).
  • Instale, actualice o elimine los drivers de GPU de NVIDIA y DOCA™.
  • Instale el kit de herramientas de contenedores NVIDIA.
  • Demuestre cómo usar las GPU de NVIDIA con Docker.
  • Instale NGC™ CLI en los hosts.
Prueba y Verificación de Clústeres 33%
  • Realice una prueba de estrés con un solo nodo.
  • Ejecute HPL (Linpack de Alto Rendimiento).
  • Realice NCCL de un solo nodo (incluida la verificación del Switch NVLink™).
  • Valide los cables verificando la calidad de la señal.
  • Confirme que el cableado es correcto.
  • Confirme FW/SW en los interruptores.
  • Confirme FW/SW en BlueField-3.
  • Confirme el FW en los transceptores.
  • Ejecute ClusterKit para realizar una evaluación de nodos multifacética.
  • Ejecute NCCL para verificar el ancho de banda de la red E/W.
  • Realice el burn-in inicial de NCCL.
  • Realice el burn-in inicial de HPL.
  • Realice el burn-in inicial de NeMo™.
  • Pruebe el almacenamiento.
Solucionar Problemas y Optimizar 12%
  • Identifique y solucione fallas de hardware (por ejemplo, GPU, ventilador, tarjeta de red). 
  • Identifique tarjetas, GPU y fuentes de alimentación defectuosas. 
  • Reemplace las tarjetas, las GPU y las fuentes de alimentación defectuosas. 
  • Ejecute la optimización del desempeño para servidores AMD e Intel. 
  • Optimice el almacenamiento.

Contáctenos

NVIDIA ofrece capacitaciones y certificaciones para profesionales que buscan mejorar sus habilidades y conocimientos en el campo de la IA, la computación acelerada, la ciencia de datos, las redes avanzadas, los gráficos, la simulación y más.

Contáctenos para obtener información sobre cómo podemos ayudarle a lograr sus objetivos.

Manténgase Actualizado

Reciba noticias sobre capacitación, anuncios y más de NVIDIA, incluida la información más reciente sobre nuevos cursos autogestionados, talleres dirigidos por instructores, capacitaciones gratuitas, descuentos y más. Puede darse de baja en cualquier momento.