NVIDIA AI

Distribuzione istantanea dell'IA generativa con NVIDIA NIM

Esplora i più recenti modelli IA creati dalla community con un'API ottimizzata e accelerata da NVIDIA, quindi distribuisci ovunque con i microservizi di inferenza NVIDIA NIM.

Scopri i migliori modelli aperti ora

Integrazione

L'IA accelerata con una chiamata API

Inizia subito con le API che già conosci.

Perfetta compatibilità con le librerie più diffuse

Usa le API NVIDIA con gli strumenti e le applicazioni esistenti, con sole tre righe di codice.

Crea con gli strumenti che ami

Lavora con i tuoi framework di programmazione LLM preferiti, tra cui Langchain e LlamaIndex, e distribuisci facilmente le tue applicazioni.

Ottieni informazioni dai dati aziendali

I dati sono alla base delle moderne applicazioni aziendali. Connetti su larga scala gli agenti IA ai dati aziendali mediante un motore di query IA che utilizza la generazione aumentata di recupero (RAG) per fornire ai dipendenti una conoscenza istituzionale accurata e istantanea.

Blueprint NVIDIA

Tutto ciò di cui hai bisogno per creare applicazioni di IA generativa di grande impatto. Ogni progetto include NVIDIA NIM e microservizi partner, uno o più agenti IA, codice di esempio, istruzioni di personalizzazione e un diagramma Helm per la distribuzione.


Esecuzione ovunque

Accelera la distribuzione dell'IA con NVIDIA NIM

Parte di NVIDIA AI Enterprise, NVIDIA NIM è un set di microservizi facili da usare per accelerare la distribuzione di modelli di base su qualsiasi cloud o data center e contribuire a mantenere i dati al sicuro.

Accelerate Your AI Deployment With NVIDIA NIM

Distribuisci NIM

Distribuisci NIM per il tuo modello con un singolo comando. È anche possibile eseguire facilmente NIM con modelli appositamente calibrati.

Esegui l'inferenza

Configura NIM con il motore di runtime ottimale basato sull'infrastruttura accelerata NVIDIA.

Creazione

Gli sviluppatori possono integrare endpoint NIM con self-hosting in poche righe di codice.

Deploy
Run
Build
docker run nvcr.io/nim/publisher_name/model_name
curl -X 'POST' \ 'http://0.0.0.0:8000/v1/completions' \ -H 'accept: application/json' \ -H 'Content-Type: application/json' \ -d '{ "model" : "model_name", "prompt" : "Once upon a time", "max_tokens" : 64 }'
import openai client = openai.OpenAI( base_url = "YOUR_LOCAL_ENDPOINT_URL", api_key="YOUR_LOCAL_API_KEY" ) chat_completion = client.chat.completions.create( model="model_name", messages=[{"role" : "user" , "content" : "Write me a love song" }], temperature=0.7 )

Avvia localmente o scala con Kubernetes

Distribuisci senza problemi i microservizi di IA containerizzati su qualsiasi infrastruttura accelerata NVIDIA, da un singolo dispositivo ai data center.

Distribuzione sicura e affidabile

Affidati ai runtime di livello di produzione, inclusi gli aggiornamenti di sicurezza in corso, ed esegui le tue applicazioni aziendali con API stabili supportate da un'assistenza di livello aziendale.

Riduzione dei costi e dell'impronta di carbonio

Riduci i costi operativi per l'esecuzione di modelli in produzione con runtime IA continuamente ottimizzati che garantiscono una bassa latenza e un alto throughput sulle infrastrutture accelerate da NVIDIA.

Throughput

NVIDIA NIM offre un throughput e una latenza ottimizzati pronti all'uso per massimizzare la generazione di token, supportare più utenti simultaneamente nelle ore con maggiore traffico e migliorare la reattività.

Configurazione: Llama3.1-8B-instruct, 1 x H100SXM; input 1000 token, output 1000 token. Richieste simultanee: 200. NIM ON: FP8. throughput 6.354 token/s, TTFT 0,4 s, ITL: 31 ms. NIM OFF: FP8. throughput 2,265 token/s, TTFT 1,1 s, ITL: 85 ms

Personalizzazione

Personalizza i microservizi NIM per le tue esigenze di dominio specifiche

Ottimizza con NVIDIA NeMo

NVIDIA NeMo™ è una piattaforma end-to-end che consente lo sviluppo dell'IA generativa personalizzata, ovunque. Grazie agli strumenti per la formazione, la personalizzazione e la generazione aumentata dal recupero (RAG), il guardrailing, la cura dei dati e il pre-training dei modelli, offre alle imprese un modo semplice, economico e veloce per adottare l'IA generativa.

See NVIDIA NIMs in Action

Come Acquistare

Inizia

Inizia a prototipare gratuitamente

Inizia con le intuitive API senza server gestite da NVIDIA.

  • Accedi all'infrastruttura IA completamente accelerata.
  • Assicurati che i tuoi dati non vengano utilizzati per l'addestramento di modelli.
  • Inizia gratuitamente con 1.000 crediti di inferenza.

Scarica e distribuisci

Esegui NVIDIA NIM per scalare modelli IA ottimizzati nel cloud o nel data center di tua scelta.

  • Assicurati che i dati non lasciino mai la tua enclave sicura.
  • Passa facilmente dagli endpoint cloud alle API self-hosted senza cambiare il codice.
  • Usa una licenza NVIDIA AI Enterprise per la produzione o inizia gratuitamente con il Programma per sviluppatori NVIDIA.

Crea modelli di IA generativa personalizzati con NVIDIA AI Foundry 

Accedi a modelli di base, software aziendali, calcolo accelerato e competenze IA per creare, ottimizzare e distribuire modelli personalizzati per le tue applicazioni aziendali.

Scenari di utilizzo

Una spinta all'innovazione

Scopri come le API NVIDIA supportano gli scenari di utilizzo del settore e inizia subito i tuoi progetti di sviluppo co IA con gli esempi selezionati.

Umani digitali

Dai vita ai personaggi dei giochi o crea avatar virtuali interattivi per migliorare il servizio clienti e rafforzare il legame tra la tua applicazione e gli utenti.

Generazione di contenuti

Genera contenuti altamente pertinenti, personalizzati e accurati, basati sulle competenze e sulla proprietà intellettuale della tua azienda.

Generazione biomolecolare

I modelli generativi biomolecolari e la potenza di calcolo delle GPU esplorano in modo efficiente lo spazio chimico, generando rapidamente diversi insiemi di piccole molecole specifiche per obiettivi o proprietà farmacologiche.

Ecosistema

Porta l'IA aziendale più lontano, più velocemente

Unisciti ai partner leader di settore per sviluppare le tue applicazioni IA con modelli, toolkit, database vettoriali,
framework e infrastrutture dal nostro ecosistema.

Risorse

Aumenta il tuo potenziale, migliora le tue competenze ed espandi le tue risorse

LaunchPad

Sblocca l'IA con un laboratorio pratico

Scopri la potenza dell'IA con soluzioni complete attraverso laboratori pratici guidati per chatbot basati su RAG, ricerca farmacologica e ottimizzazioni dei percorsi.

Deep Learning Institute

Migliora le tue competenze in IA

Il DLI offre corsi di formazione autogestiti per singoli o per aziende che desiderano aumentare il bagaglio di competenze del personale su IA generativa, scienza dei dati e non solo.

AI Workbench

Inizia con poco. Scala alla grande.

NVIDIA AI Workbench offre agli sviluppatori la flessibilità di eseguire modelli compatibili con API su container locali o remoti basati su GPU. Questo consente flussi di lavoro interattivi, dalla sperimentazione alla prototipazione fino al proof of concept.

Notizie

Scopri NVIDIA NIM nelle notizie

Dai un'occhiata agli ultimi comunicati stampa di NVIDIA per scoprire come NIM e l'IA generativa stanno influenzando diversi settori, partner, clienti e non solo.

Documentazione

Esplora la documentazione tecnica per iniziare a creare prototipi e applicazioni IA aziendali con le API NVIDIA.