L'inferenza dell'IA, ovvero il modo in cui sperimentiamo l'IA attraverso chatbot, copiloti e strumenti creativi, sta crescendo a un doppio ritmo esponenziale. L'adozione da parte degli utenti sta accelerando, mentre i token IA generati per interazione, basati su flussi di lavoro per agenti, ragionamento a lungo termine e modelli a combinazione di esperti (MoE), aumentano in parallelo.
Per consentire l'inferenza su questa scala massiccia, NVIDIA offre un'architettura su larga scala per i data center annualmente. La nostra progettazione estrema di hardware e software offre salti di qualità nelle prestazioni, riduce il costo per token e genera maggiori ricavi e profitti.
NVIDIA Blackwell NVL72 offre prestazioni di inferenza più di 10 volte migliori rispetto a NVIDIA H200 in una vasta gamma di modelli MoE, tra cui Kimi K2 Thinking, DeepSeek-R1 e Mistral Large 3.
La piattaforma di inferenza NVIDIA offre una serie di vantaggi racchiusi nel framework Think SMART, tra cui scalabilità ed efficienza, prestazioni multidimensionali, architettura e coprogettazione software, ROI basato sulle prestazioni e un ampio ecosistema tecnologico.
NVIDIA Blackwell offre prestazioni leader del settore in diversi casi d'uso, bilanciando efficacemente più dimensioni: throughput, latenza, intelligenza, costi ed efficienza energetica. Per i modelli intelligenti mixture-of-experts come Kimi K2 Thinking, DeepSeek-R1 e Mistral Large 3, gli utenti possono ottenere prestazioni fino a 10 volte più veloci su NVIDIA Blackwell NVL72 rispetto a H200.
NVIDIA Blackwell NVL72 offre 1/10 del costo per token per i modelli MoE. Le prestazioni rappresentano la leva più grande per ridurre i costi per token e massimizzare le entrate IA. Processando un numero di token dieci volte superiore con lo stesso tempo e lo stesso livello di energia, il costo per token si riduce notevolmente, consentendo ai MoE di essere distribuiti nei prodotti di uso quotidiano.
Grazie a un'innovazione completa nel calcolo, nella rete di networking e nel software, NVIDIA consente di scalare in modo efficiente distribuzioni IA complesse.
NVIDIA offre una piattaforma collaudata con una base installata di centinaia di milioni di GPU CUDA®, 7 milioni di sviluppatori, contributi a oltre 1.000+ progetti open-source e integrazioni profonde con framework come PyTorch, JAX, SGLang, vLLM e molto altro ancora
Le prestazioni aumentano la redditività
Più velocemente il sistema è in grado di generare token, offrendo al contempo un'esperienza utente fluida, maggiori saranno le entrate che potrai ottenere con la stessa potenza e costi. NVIDIA Blackwell genera 75 milioni di dollari di fatturato per ogni 5 milioni di dollari di CAPEX spesi, un ritorno sull'investimento di 15x.
Un hardware potente senza un'orchestrazione intelligente spreca il potenziale; un software eccellente senza hardware veloce significa prestazioni di inferenza lente. L'innovazione completa di NVIDIA nei settori di calcolo, rete e software consente le massime prestazioni su diversi carichi di lavoro. Scopri alcune delle principali innovazioni hardware e software NVIDIA.