NVIDIA Base Command Manager

Soluciones de Infraestructura de IA

Rejillas de IA

Escale aplicaciones nativas de la IA orquestando cargas de trabajo en toda la infraestructura de IA distribuida geográficamente.

Descripción General

Infraestructura Distribuida para IA Generativa, Agéntica y Física

Las aplicaciones de IA modernas son en tiempo real, hiperpersonalizadas y de uso intensivo de datos, y ofrecen servicios a millones de usuarios, agentes y máquinas en todo el mundo. Los operadores de telecomunicaciones se encuentran en una posición única para satisfacer esta demanda al convertir su infraestructura existente en redes de IA, lo que acerca la IA a donde se usa la inteligencia.

Una cuadrícula de IA es una plataforma de infraestructura de IA distribuida, interconectada y orquestada que ejecuta cada carga de trabajo allí donde mejor funciona. Conecta fábricas de IA con centros regionales y sitios edge de forma que datos, modelos y agentes puedan moverse de forma segura entre sitios distribuidos que operan como un sistema unificado. 

NVIDIA proporciona la computación acelerada, las redes y la pila de software que impulsa las redes de IA, lo que ayuda a los operadores a liberar rápidamente la capacidad de IA distribuida e impulsar nuevas experiencias nativas de IA

NVIDIA y los líderes de las telecomunicaciones desarrollan redes de IA para optimizar la inferencia en redes distribuidas

A medida que las aplicaciones nativas de la IA escalan a más usuarios, agentes y dispositivos, la red de telecomunicaciones se está convirtiendo en la próxima frontera para la distribución de la IA.

Desarrolle e Implemente Redes de IA Fácilmente con NVIDIA

El diseño de referencia de la cuadrícula de IA de NVIDIA brinda a los operadores una forma unificada de desarrollar, implementar y orquestar la IA en sitios distribuidos.

Beneficios

Ejecute cada carga de trabajo de IA en la ubicación más idónea

Latencia predecible

Mantenga la capacidad de respuesta de los servicios nativos de IA ejecutando la inferencia en la infraestructura más cercana a los usuarios, los agentes y las máquinas. Esto ayuda a los operadores a cumplir con estrictos acuerdos de nivel de servicio (SLA) para experiencias de voz, visión y control en tiempo real.

Mejor Economía de Tokens

Ejecute cargas de trabajo de uso intensivo de tokens en nodos con la computación y las redes más rentables, lo que reduce el volumen de datos a través de la red y los costos de salida sin sacrificar la calidad de servicio.

Mayor Utilización y Resiliencia

Trate muchos sitios distribuidos como un solo grupo de capacidad de IA para impulsar la utilización de las GPU y reducir los recursos infrautilizados. Si un sitio falla, las cargas de trabajo se reequilibran automáticamente en toda la red para mantener la continuidad del servicio.

Concurrencia a Escala

Ejecute servicios nativos de IA en muchos sitios distribuidos para manejar ráfagas masivas de usuarios, aplicaciones y agentes simultáneos, al tiempo que mantiene una calidad de experiencia y un costo consistentes.

Productos

Los Componentes Básicos de una Red de IA

NVIDIA ofrece una plataforma unificada para equipar a los sitios distribuidos con infraestructura de IA de pila completa, lo que los convierte en redes de IA conectadas y orquestadas.

GPU de Alto Rendimiento

En las fábricas de IA centralizadas, los sistemas a escala de bastidor como NVIDIA GB300 NVL72 ofrecen un rendimiento extremo para el entrenamiento, el ajuste fino y las cargas de trabajo de razonamiento a gran escala. En todos los sitios de la red distribuida, las GPU NVIDIA RTX PRO™ 6000 Blackwell Server Edition proporcionan una plataforma de inferencia versátil y rentable que puede caber en el espacio de telecomunicaciones existente con una modernización mínima.

NVIDIA Spectrum-X Ethernet

Mediante el acceso directo a memoria remota (RDMA) a través de Ethernet convergente (RoCE) y el control de congestión optimizado, NVIDIA Spectrum-X Ethernet acelera el desempeño del almacenamiento en casi un 50 % y reduce los cuellos de botella de la comunicación. Así, las empresas pueden escalar las aplicaciones de IA de forma eficiente y, al mismo tiempo, maximizar la utilización del sistema de IA.

DPU NVIDIA BlueField

Las DPU NVIDIA BlueField descargan, aceleran y aíslan los servicios de infraestructura en las fábricas de IA y los entornos distribuidos globalmente, lo que permite a múltiples inquilinos y cargas de trabajo compartir una infraestructura común de alto desempeño de forma segura y eficiente. Los operadores de telecomunicaciones integran BlueField para mejorar la seguridad y optimizar el rendimiento y la eficiencia de la IA.

TensorRT LLM

NVIDIA TensorRT™ LLM es una biblioteca de código abierto para la inferencia de grandes modelos de lenguaje (LLM) de alto desempeño y en tiempo real en las GPU de NVIDIA. Con un tiempo de ejecución de Python modular, autoría nativa de PyTorch y una API de producción estable, está optimizado para maximizar el rendimiento, minimizar los costos y ofrecer experiencias rápidas al usuario.

NVIDIA Dynamo

NVIDIA Dynamo es un framework distribuido de servicio de inferencia para implementar modelos en entornos de múltiples nodos a escala de fábricas de IA. Optimiza el servicio distribuido al desagregar la inferencia, mejorando así el enrutamiento y extendiendo la memoria a través del almacenamiento en caché de datos a niveles de almacenamiento rentables.

Microservicios NVIDIA NIM

NVIDIA NIM™ es un conjunto de microservicios de inferencia fáciles de usar para acelerar la implementación de modelos básicos y mantener la seguridad de los datos. NVIDIA NIM está optimizado para la inferencia a escala empresarial.

Casos de Uso

Inteligencia Distribuida en Acción

Explore cómo las rejillas de IA impulsadas por NVIDIA permiten una nueva clase de aplicaciones nativas de IA que exigen un acceso a la inteligencia en tiempo real y a bajo costo a escala.

IA Física

La IA física permite a los robots, vehículos, cámaras y sistemas de IoT percibir, razonar y actuar en el mundo físico. Las rejillas de IA permiten a NVIDIA Metropolis ejecutar la IA de visión a escala de ciudad cerca de las cámaras para el análisis en tiempo real, mientras que los robots autónomos descargan la planificación y el razonamiento más pesados a sitios cercanos cuando la computación integrada no es suficiente.

IA en Tiempo Real

Los servicios de IA interactiva, como los asistentes de IA conversacional, dependen de una latencia estricta de extremo a extremo y un control de jitter para sentirse naturales y con capacidad de respuesta. Las redes de IA ejecutan estas cargas de trabajo en nodos físicamente cercanos a los datos, lo que preserva el margen de latencia y enruta cada solicitud a los mejores recursos disponibles, incluso durante picos de demanda o cortes parciales.

Hiperpersonalización

Los asistentes de IA personalizados, las experiencias de medios y deportes, y las aplicaciones empresariales deben adaptar respuestas en tiempo real para miles o millones de sesiones simultáneas. En una rejilla de IA, los operadores pueden almacenar en caché el contexto del usuario o del inquilino en los nodos regionales y ejecutar la lógica de personalización y generación más cerca de los usuarios, lo que mejora la latencia de cola y hace que la economía de la personalización siempre activa siga siendo sostenible.

Funciones de Red Nativas de IA

Las cargas de trabajo de red como la RAN, la dirección del tráfico y la optimización del plano del usuario dependen cada vez más de la IA para analizar flujos y tomar decisiones en tiempo real. Las redes de IA ejecutan estas funciones de red nativas de IA en la misma infraestructura distribuida que las aplicaciones, lo que mejora la utilización y permite un enrutamiento más inteligente, la aplicación de políticas y la calidad de la experiencia en toda la red.

Próximos Pasos

¿Todo Listo para Comenzar?

Desarrolle redes de IA a escala con el diseño de referencia de NVIDIA AI Grid, que proporciona una pila de hardware y software unificada que transforma los sitios distribuidos en una infraestructura de IA conectada y orquestada.

Contáctenos

Háganos preguntas o solicite más información. Nuestros expertos están aquí para ayudar.

Manténgase al Día con las Noticias de NVIDIA

Regístrese para recibir las últimas noticias de IA y telecomunicaciones de NVIDIA.