Stabilire un nuovo record nel MLPerf

Le soluzioni di training e inferenza NVIDIA offrono risultati MLPerf con performance da record, il benchmark leader del settore per le prestazioni IA.

Cos'è MLPerf?

MLPerf è un consorzio di leader nell'intelligenza artificiale per mondo accademico, laboratori di ricerca e settori la cui missione è la "creazione di benchmark equi e utili" che forniscano valutazioni imparziali sulle prestazioni di inferenza e training di hardware, software e servizi, il tutto condotto in condizioni prestabilite. Per rimanere all'avanguardia nelle tendenze del settore, MLPerf continua a evolversi, tenendo nuovi test a intervalli regolari e aggiungendo nuovi carichi di lavoro che rappresentano lo stato dell'arte nell'IA.

Categorie di invio di contenuti MLPerf

MLPerf Training v0.7 è la terza istanza di training e consiste in otto carichi di lavoro diversi che ricoprono svariati ambienti, tra cui la visione, la lingua, i consigli e l'apprendimento di rinforzo.

Il benchmark MLPerf Inference v0.7 ha testato sette diversi casi d'uso su sette diversi tipi di reti neurali. Tre di questi erano per computer vision, uno per i sistemi recommender, due per l'elaborazione del linguaggio e uno per la diagnostica per immagini.

Classificazione di immagini

Classificazione di immagini

Assegna un';etichetta proveniente da una serie fissa di categorie a un immagine acquisita, es. riguarda i problemi di visione del computer come i veicoli autonomi. Dettagli.

Rilevamento di oggetti (leggero)

Rilevamento di oggetti (leggero)

Rileva istanze di oggetti del mondo reale come visi, biciclette ed edifici all';interno di immagini o video e delinea una bounding box attorno ad essi. dettagli.

Rilevamento di oggetti (pesante)

Rilevamento di oggetti (pesante)

Rileva distinti oggetti d';interesse che vengono visualizzati in un immagine e calcola una maschera di pixel per ognuno. Dettagli.

Traduzione (ricorrente)

Traduzione (ricorrente)

Traduce un testo da una lingua verso un';altra utilizzando una rete neutrale ricorrente (RNN). dettagli.

Traduzione (non ricorrente)

Traduzione (non ricorrente)

Traduce un testo da una lingua verso un';altra utilizzando una rete neutrale feed-forward. dettagli.

Natural Language Processing (NLP)

Natural Language Processing (NLP)

Comprende il testo usando la relazione tra parole diverse in un blocco di testo. Consente la risposta alle domande, la parafrasi delle frasi e molti altri casi d'uso correlati alla lingua. Dettagli.

Consigli

Consigli

Offre risultati personalizzati nei servizi rivolti agli utenti, come social media o siti di e-commerce, apprendendo le interazioni tra utenti e servizi, come prodotti o annunci. Dettagli.

Apprendimento di rinforzo

Apprendimento di rinforzo

Valuta le diverse azioni possibili per massimizzare la ricompensa utilizzando il gioco di strategia Go giocato su una griglia 19x19. dettagli.

I risultati di NVIDIA nel benchmark MLPerf

  • Training

    Training

  • Inferenza

    Inferenza

La GPU NVIDIA A100 Tensor Core e la NVIDIA DGX SuperPOD hanno stabilito tutti i 16 record di prestazioni di training, sia in carichi di lavoro per chip che su larga scala per sistemi disponibili in commercio. Queste prestazioni rivoluzionarie derivano dalla stretta integrazione di hardware, software e tecnologie a livello di sistema. Il continuo investimento di NVIDIA nelle prestazioni full-stack ha portato a un miglioramento della produttività rispetto ai tre contesti del MLPerf.

PRESTAZIONI MLPERF FINO A 4 VOLTE SUPERIORI IN 1,5 ANNI

L'innovazione full-stack di NVIDIA offre miglioramenti continui

PRESTAZIONI MLPERF FINO A 4 VOLTE SUPERIORI IN 1,5 ANNI

NVIDIA ha stabilito tutti i 16 record

Per soluzioni disponibili in commercio

  Record di scala massima Record per acceleratore
Consigli (DLRM) 3,33 min 0,44 ore
NLP (BERT) 0,81 min 6,53 ore
Apprendimento di rinforzo (MiniGo) 17,07 min 39,96 ore
Traduzione (non ricorrente) (trasformatore) 0,62 min 1,05 ore
Traduzione (ricorrente) (GNMT) 0,71 min 1,04 ore
Rilevamento di oggetti (pesante) (Mask R-CNN) 10,46 min 10,95 ore
Rilevamento di oggetti (leggero) (SSD) 0,82 min 1,36 ore
Classificazione di immagini (ResNet-50 v1.5) 0,76 min 5,30 ore

NVIDIA ha ottenuto i migliori risultati di prestazioni in tutti gli scenari (server in data center e offline, con Edge single-stream, multi-stream e offline). Inoltre, abbiamo ottenuto le migliori prestazioni per acceleratore tra tutti i prodotti testati nei test del benchmark. Questi risultati sono una vera e propria certificazione non solo della leadership di NVIDIA nelle prestazioni per inferenza, ma anche della versatilità della nostra piattaforma.

Scenario offline per data center e edge (GPU singola)

  NVIDIA A100
(inferenze/secondo)
NVIDIA A30
(inferenze/secondo)
NVIDIA A10
(inferenze/secondo)
NVIDIA® Jetson Xavier
(max inferenze/query)
DLRM
(recommender)
307,788 133,439 96,547 N/D*
BERT
(elaborazione del linguaggio naturale)
3,543 1,658 1,057 92
ResNet-50 v1.5
(classificazione di immagini)
38,110 17,690 13,210 2,072
ResNet-34
(rilevatore grande single-shot)
985 470 312 57
RNN-T
(riconoscimento vocale)
13,210 6,461 4,515 433
3D U-NET
(diagnostica per immagini)
60 30 22 3

La tecnologia dietro ai risultati

La complessità dell'IA richiede una stretta integrazione di tutti gli aspetti della piattaforma. Come dimostrato dai benchmark MLPerf, la piattaforma IA NVIDIA offre prestazioni di leadership con la GPU più avanzata al mondo, tecnologie di interconnessione potenti e scalabili e software all'avanguardia, una soluzione end-to-end che può essere installata nel data center, nel cloud o sull'edge con risultati straordinari.

Software ottimizzato che accelera i flussi di lavoro IA

Software ottimizzato che accelera i flussi di lavoro IA

Fattore essenziale dei risultati di training e inferenze MLPerf e della piattaforma NVIDIA, il catalogo NGC è un hub ottimizzato da GPU per software IA, calcolo ad alte prestazioni (HPC) e analisi dei dati che semplifica e accelera i flussi di lavoro completi. Con oltre 150 container di livello enterprise, cui carichi di lavoro per IA conversazionale e sistemi recommender, oltre 100 modelli e SDK specifici per settore che possono essere distribuiti in locale, nel cloud o sui sistemi Edge, il catalogo NGC permette agli esperti di dati, ai ricercatori e agli sviluppatori di creare soluzioni all'avanguardia, ricavare dati utili e fornire valore aziendale più velocemente che mai.

Infrastruttura IA leader

Per ottenere risultati leader a livello mondiale in materia di formazione e inferenze è necessaria un'infrastruttura appositamente costruita per le sfide di intelligenza artificiale più complesse del mondo. La piattaforma NVIDIA AI fornita con la potenza della GPU NVIDIA A100 Tensor Core, la GPU NVIDIA A30 Tensor Core, la GPU NVIDIA A10 Tensor Core e la scalabilità e flessibilità delle tecnologie di interconnessine NVIDIA, NVIDIA NVLink®, NVIDIA NVSwitch e NVIDIA ConnectX®-6 VPI. Questi prodotti sono al centro della NVIDIA DGX A100, il motore dietro le nostre prestazioni di riferimento.

I sistemi NVIDIA DGX offrono la scalabilità, la rapida installazione e l'incredibile potenza di elaborazione utili per tutte le aziende per progettare un'infrastruttura IA a livello di leadership.

Infrastruttura IA leader

Scopri di più sulle prestazioni dei nostri prodotti per l'inferenza e il training del data center.