Análisis de Referencia MLPerf

La plataforma de IA de NVIDIA logra un desempeño y una versatilidad de primer nivel en los análisis de referencia MLPerf de entrenamiento, inferencia y HPC para las cargas de trabajo de IA más exigentes y del mundo real.

Ver nuestros resultados

Acerca de MLPerf
Análisis de Referencia
Nuestros Resultados
Cómo lo Hacemos

Acerca de MLPerf
Análisis de Referencia
Nuestros Resultados
Cómo lo Hacemos

¿Qué es MLPerf?

Los análisis de referencia MLPerf™, desarrollados por MLCommons, un consorcio de líderes de IA del mundo académico, laboratorios de investigación y la industria, están diseñados para proporcionar evaluaciones imparciales del desempeño de entrenamiento e inferencia para hardware, software y servicios. Todos se realizan según condiciones prescritas. Para mantenerse a la vanguardia de las tendencias de la industria, MLPerf continúa evolucionando, realiza nuevas pruebas a intervalos regulares y agrega nuevas cargas de trabajo que representan el estado de la cuestión en IA.

Chalmers University es una de las principales instituciones de investigación en Suecia, especializada en múltiples áreas, desde la nanotecnología hasta los estudios climáticos. A medida que incorporamos la IA para avanzar en nuestros esfuerzos de investigación, encontramos que el análisis de referencia MLPerf proporciona una comparación transparente y directa entre múltiples plataformas de IA para mostrar el verdadero desempeño en diversos casos de uso en el mundo real.

— Chalmers University of Technology, Suecia

TSMC lidera la vanguardia en semiconductores globales, como nuestro último nodo de 5 nm, que lidera el mercado en tecnología de procesos. Innovaciones como la litografía y el modelado de grabado que se basan en el aprendizaje automático mejoran drásticamente nuestra corrección de proximidad óptica (OPC) y la exactitud de la simulación de grabado. Para aprovechar plenamente el potencial del aprendizaje automático en el entrenamiento y la inferencia de modelos, estamos trabajando con el equipo de ingeniería de NVIDIA para adaptar nuestro motor de simulación y tecnología de litografía inversa (ILT) Maxwell a las GPU y ver aceleraciones muy significativas. El análisis de referencia MLPerf es un factor importante en nuestra toma de decisiones.

— Dr. Danping Peng, director del Departamento de OPC, TSMC, San Jose, CA, Estados Unidos

La visión y las imágenes por computadora son el núcleo de la investigación en IA, impulsan el descubrimiento científico y representan fácilmente componentes centrales de la atención médica. Hemos trabajado en estrecha colaboración con NVIDIA para llevar innovaciones como 3DUNet al mercado del área de la salud. Los análisis de referencia estándar de la industria MLPerf proporcionan datos de desempeño relevantes para el beneficio de las organizaciones de TI y los desarrolladores, para obtener la solución correcta y acelerar sus aplicaciones y proyectos específicos.

— Prof. Dr. Klaus Maier-Hein, director de Computación de Imágenes Médicas, Deutsches Krebsforschungszentrum (DKFZ, Centro Alemán de Investigación del Cáncer)

Como líder preeminente en investigación y manufactura, Samsung usa la IA para aumentar drásticamente el desempeño de sus productos y la productividad en la manufactura. Producir estos avances en IA requiere tener la mejor plataforma de computación disponible. El análisis de referencia MLPerf agiliza nuestro proceso de selección al proporcionarnos un método de evaluación abierto y directo para evaluar de manera uniforme en todas las plataformas.

— Samsung Electronics

Diapositiva 1
Diapositiva 2
Diapositiva 3
Diapositiva 3

Dentro de los Análisis de Referencia de MLPerf

MLPerf Inference v5.1 mide el desempeño de inferencia en 10 modelos de IA diferentes, que incluyen una variedad de grandes modelos de lenguaje (LLM), un LLM de razonamiento, IA generativa de texto a imagen, recomendaciones, conversión de texto a voz y redes neuronales gráficas (GNN).

MLPerf Training v5.1 mide el tiempo necesario para entrenar siete modelos diferentes que cubren los siguientes casos de uso: LLM (preentrenamiento y ajuste fino), generación de imágenes, GNN, detección de objetos y recomendaciones.

Gran Modelo de Lenguaje de Razonamiento

Gran modelo de lenguaje que genera tokens de razonamiento o pensamiento intermedios para mejorar la exactitud de la respuesta.

Detalles

Grandes Modelos de Lenguaje

Algoritmos de aprendizaje profundo entrenados en conjuntos de datos a gran escala que pueden reconocer, resumir, traducir, predecir y generar contenido para una amplia gama de casos de uso.

Detalles

Texto a Imagen

Genera imágenes a partir de indicaciones de texto.

Detalles

Recomendaciones

Ofrece resultados personalizados en servicios orientados al usuario, como redes sociales o sitios web de comercio electrónico, al comprender las interacciones entre los usuarios y los elementos de servicio, como productos o anuncios.

Detalles

Detección de Objetos (ligero)

Encuentra instancias de objetos del mundo real como rostros, bicicletas y edificios en imágenes o videos y especifica un cuadro delimitador alrededor de cada uno.

Detalles

Red Neuronal Gráfica

Usa redes neuronales diseñadas para trabajar con datos estructurados como grafos.

Detalles

Voz a Texto

Convierte el lenguaje hablado en texto escrito.

Detalles

Resultados de NVIDIA en los Análisis de Referencia MLPerf

Entrenamiento
Inferencia

La plataforma NVIDIA logró el tiempo más rápido para entrenar en los siete análisis de referencia MLPerf v5.1 Training. Blackwell Ultra hizo su debut, ofreciendo grandes avances en el preentrenamiento y el ajuste de grandes modelos de lenguaje, gracias a mejoras arquitectónicas y a métodos de entrenamiento NVFP4 innovadores que aumentan el desempeño y cumplen con los estrictos requisitos de precisión de MLPerf. NVIDIA también aumentó el desempeño de preentrenamiento de Blackwell Llama 3.1 405B a escala en 2.7 veces a través de una combinación de duplicación de la escala y grandes aumentos en el desempeño por GPU habilitados por NVFP4. NVIDIA también estableció récords de desempeño en los dos análisis de referencia recientemente agregados (Llama 3.1 8B y FLUX.1), a la vez que continúa teniendo récords de desempeño en análisis de referencia existentes de recomendaciones, detección de objetos y redes neuronales gráficas.

NVIDIA Blackwell Ultra Ofrece un Gran Salto en el Debut de MLPerf Training

Los resultados de MLPerf™ Training v5.0 y v5.1 se recuperaron de www.mlcommons.org el 12 de noviembre de 2025, de las siguientes entradas: 4.1-0050, 5.0-0014, 5.0-0067, 5.0-0076, 5.1-0058, 5.1-0060. El nombre y el logotipo MLPerf™ son marcas comerciales de MLCommons Association en los Estados Unidos y otros países. Todos los derechos reservados. El uso no autorizado está estrictamente prohibido. Consulte www.mlcommons.org para obtener más información.

Ritmo Anual y Codiseño Extremo para un Liderazgo en Entrenamiento Sostenido

La plataforma NVIDIA ofreció el tiempo de entrenamiento más rápido en todos los análisis de referencia de MLPerf Training v5.1, con innovaciones en chips, sistemas y software que permiten un liderazgo sostenido en el desempeño del entrenamiento, como lo demuestran los datos de desempeño estándar de la industria y revisados por pares.

Desempeño a Máxima Escala

Benchmark	Time to Train
LLM Pretraining (Llama 3.1 405B)	10 minutes
LLM Pretraining (Llama 3.1 8B)	5.2 minutes
LLM Fine-Tuning (Llama 2 70B LoRA)	0.40 minutes
Image Generation (FLUX.1)	12.5 minutes
Recommender (DLRM-DCNv2)	0.71 minutes
Graph Neural Network (R-GAT)	0.84 minutes
Object Detection (RetinaNet)	1.4 minutes

Los resultados de MLPerf™ Training v5.0 y v5.1 se recuperaron de www.mlcommons.org el 12 de noviembre de 2025, de las siguientes entradas: 5.0-0082, 5.1-0002, 5.1-0004, 5.1-0060, 5.1-0070, 5.1-0072. El nombre y el logotipo MLPerf™ son marcas comerciales de MLCommons Association en los Estados Unidos y otros países. Todos los derechos reservados. El uso no autorizado está estrictamente prohibido. Consulte www.mlcommons.org para obtener más información.

Blackwell Ultra Establece Nuevos Récords de Inferencia de Razonamiento en MLPerf Inference v5.1

La plataforma NVIDIA estableció muchos nuevos récords en MLPerf Inference v5.1 (incluso en las nuevas y desafiantes pruebas de razonamiento DeepSeek-R1 y Llama 3.1 405B Interactive) y continúa teniendo todos los récords de desempeño de MLPerf Inference por GPU en la categoría de centros de datos. El sistema GB300 NVL72, basado en la arquitectura de GPU NVIDIA Blackwell Ultra, hizo su debut solo seis meses después de NVIDIA Blackwell, estableciendo nuevos récords en el análisis de referencia de inferencia de razonamiento DeepSeek-R1. Y NVIDIA Dynamo también hizo su debut en esta ronda, con su servicio desagregado, aumentando drásticamente el desempeño de cada GPU Blackwell en Llama 3.1 405B Interactive. El desempeño y el ritmo de innovación en la plataforma de NVIDIA permiten una mayor inteligencia, un mayor potencial de ingresos para fábricas de IA y un menor costo por millón de tokens.

La Plataforma de NVIDIA Tiene Todos los Récords por GPU de Centros de Datos en MLPerf Inference

Benchmark	Offline	Server	Interactive
DeepSeek-R1	5,842 Tokens/Second	2,907 Tokens/Second	*
Llama 3.1 405B	224 Tokens/Second	170 Tokens/Second	138 Tokens/Second
Llama 2 70B 99.9%	12,934 Tokens/Second	12,701 Tokens/Second	7,856 Tokens/Second
Llama 3.1 8B	18,370 Tokens/Second	16,099 Tokens/Second	15,284 Tokens/Second
Mistral 8x7B	16,099 Tokens/Second	16,131 Tokens/Second	*
Stable Diffusion XL	4.07 Samples/Second	3.59 Queries/Second	*
DLRMv2 99%	87,228 Tokens/Second	80,515 Tokens/Second	*
DLRMv2 99.9%	48,666 Tokens/Second	46,259 Tokens/Second	*
RetinaNet	1,875 samples/second/GPU	1,801 queries/second/GPU	*
Whisper	5,667 Tokens/Second	*	*
Graph Neural Network	81,404 Tokens/Second	*	*

* Escenarios que no forman parte de los análisis de referencia MLPerf Inference v5.0 o v5.1.

MLPerf Inference v5.0 y v5.1, División Cerrada. Resultados recuperados de www.mlcommons.org el 9 de septiembre de 2025. Los resultados de la plataforma NVIDIA provienen de las siguientes entradas: 5.0-0072, 5.1-0007, 5.1-0053, 5.1-0079, 5.1-0028, 5.1-0062, 5.1-0086, 5.1-0073, 5.1-0008, 5.1-0070,5.1-0046, 5.1-0009, 5.1-0060, 5.1-0072. 5.1-0071, 5.1-0069 El desempeño por chip se obtiene dividiendo el rendimiento total por la cantidad de chips reportados. El desempeño por chip no es una métrica principal de MLPerf Inference v5.0 o v5.1. El nombre y el logotipo MLPerf son marcas comerciales registradas y no registradas de MLCommons Association en los Estados Unidos y otros países. Todos los derechos reservados. El uso no autorizado está estrictamente prohibido. Consulte http://www.mlcommons.org para obtener más información.

La Tecnología Detrás de los Resultados

La complejidad de la IA exige una estrecha integración entre todos los aspectos de la plataforma. Como quedó demostrado en los análisis de referencia MLPerf, la plataforma de IA de NVIDIA ofrece un desempeño líder con la GPU más avanzada del mundo, tecnologías de interconexión potentes y escalables y software de vanguardia. Por lo tanto, es una solución integral que se puede implementar en el centro de datos, en la nube o en el perímetro de la red con resultados increíbles.

Software optimizado que acelera los flujos de trabajo de IA

El catálogo NGC™, un componente esencial de la plataforma de NVIDIA y de los resultados de entrenamiento e inferencia de MLPerf, es un centro de software de IA, HPC y análisis de datos optimizado para GPU que simplifica y acelera los flujos de trabajo integrales. Con más de 150 contenedores de nivel empresarial (incluidas cargas de trabajo para IA generativa, IA conversacional y sistemas de recomendación), cientos de modelos de IA y SDK específicos de la industria que se pueden implementar en las instalaciones, en la nube o en el perímetro, NGC permite a los científicos de datos, investigadores y desarrolladores crear soluciones de primer nivel, recopilar información y ofrecer valor empresarial más rápido que nunca.

Visite el Catálogo de NGC

Infraestructura de IA Líder

Lograr resultados de primer nivel en entrenamiento e inferencia requiere una infraestructura diseñada específicamente para los desafíos de IA más complejos del mundo. La plataforma de IA de NVIDIA ofreció un desempeño líder impulsado por las plataformas NVIDIA Blackwell y Blackwell Ultra, que incluyen los sistemas NVIDIA GB300 NVL72 y GB200 NVL72, NVLink y NVLink Switch, y Quantum InfiniBand. Estos son el corazón de las fábricas de IA impulsadas por la plataforma de centros de datos de NVIDIA, el motor detrás de nuestro desempeño de referencia.

Además, los sistemas NVIDIA DGX™ ofrecen la escalabilidad, la implementación rápida y la increíble potencia de computación que permiten a todas las empresas desarrollar una infraestructura de IA de primer nivel.

Más Información Sobre las Soluciones para Fábricas de IA de NVIDIA

Posibilitar la IA Generativa en el Perímetro con un Desempeño Transformador

NVIDIA Jetson Orin ofrece una capacidad de cálculo de IA sin precedentes, una gran memoria unificada y pilas de software completas, que ofrecen una eficiencia energética superior para impulsar las aplicaciones generativas de IA más recientes. Es capaz de hacer una inferencia rápida de cualquier modelo de IA generativa gracias a la arquitectura Transformer, proporcionando un desempeño superior en el perímetro en MLPerf.

Más información sobre NVIDIA Jetson Orin