MLPerf Inference v4.1 misst die Inferenzleistung auf neun verschiedenen Benchmarks, darunter mehrere große Sprachmodelle (LLMs), Text-zu-Bild, Verarbeitung natürlicher Sprache, Empfehlungen, Computer Vision und Segmentierung medizinischer Bilder.
MLPerf Training v4.1 misst die Zeit für das Trainieren auf sieben verschiedenen Benchmarks, darunter LLM-Vortraining, LLM-Feinabstimmung, Text-zu-Bild, neuronales Graphen-Netzwerk (Graph Neural Network, GNN), Computer Vision, Empfehlung und Verarbeitung natürlicher Sprache.
MLPerf HPC v3.0 misst die Trainingsleistung in vier verschiedenen wissenschaftlichen Computing-Anwendungsfällen, einschließlich der Identifizierung von klimatisch-atmosphärischen Flüssen, der Vorhersage kosmologischer Parameter, der quantenmolekularen Modellierung und der Proteinstrukturvorhersage.