Acelere la innovación en la nube

Diagnóstico del cáncer. Predicción de huracanes. Automatización de operaciones empresariales. Estos son algunos de los avances posibles cuando se utiliza la computación acelerada para desvelar las ideas que se ocultan en grandes volúmenes de datos. Amazon Web Services (AWS) y NVIDIA colaboran desde 2010 para ofrecer la nube más potente y avanzada con aceleración de GPU para ayudar a los clientes a crear un futuro más inteligente.

Varias nuevas colaboraciones, anunciadas en la GTC 2026, que van desde el procesamiento de datos con tecnología de NVIDIA en AWS hasta la familia de modelos NVIDIA Nemotron™, continúan ofreciendo innovación de pila completa. Lea los anuncios aquí.

Impulse nuevas capacidades con AWS y NVIDIA

Asistencia sanitaria

Acelerar el descubrimiento de fármacos y el análisis genómico con los microservicios NVIDIA BioNeMo™ y NIM™ en AWS HealthOmics. Los investigadores pueden acceder a modelos de IA optimizados para la predicción de la estructura de proteínas y la química generativa, lo que reduce el tiempo de obtención de información y permite flujos de trabajo de biología rentables y escalables.

Servicios financieros

Mejore la detección de fraude y la verificación de identidad con el modelo de IA de NVIDIA para la detección de fraude financiero en AWS para que las instituciones financieras identifiquen patrones sutiles y anomalías en los datos de transacciones.

Sector automotriz y de manufactura

Simule gemelos digitales industriales, procesos y operaciones físicamente precisos con NVIDIA Omniverse™ en AWS. Los fabricantes de automóviles y empresas de logística, como Amazon Robotics, simulan líneas de producción y robots móviles autónomos en entornos virtuales para optimizar los flujos de trabajo antes de la implementación física.

Sector público

Permita a los organismos aprovechar la IA y la computación de alto rendimiento (HPC) a gran escala con computación acelerada de pila completa para apoyar misiones como IA generativa, análisis de datos a gran escala, simulaciones físicas e IA física. AWS European Sovereign Cloud, con la tecnología de la plataforma NVIDIA Blackwell, NVIDIA Run:ai y NVIDIA AI Enterprise, permite a las organizaciones europeas implementar aplicaciones de IA de forma segura.

Telecomunicaciones

Optimice las operaciones de red y las experiencias de los clientes con Telco AI Fellowship, una colaboración con AWS y NVIDIA. Utilice la IA agentiva para impulsar la eficiencia operativa y nuevos flujos de ingresos en voz, vídeo y datos.

Medios audiovisuales y entretenimiento

Agilice la creación de contenido con estaciones de trabajo virtuales basadas en la nube con NVIDIA RTX™ en AWS. Las canalizaciones de producción aceleradas por IA ofrecen contenido de mayor calidad más rápido, el análisis de datos proporciona información más profunda, la distribución y la monetización están optimizadas y la infraestructura definida por software mejora el entretenimiento en directo.

Energía

Acelerar la exploración y la producción subsuperficial, optimizar los equipos y operaciones de campo, aumentar la fiabilidad y la resiliencia de la red y aumentar la generación de energía renovable.

Explorar casos de éxito

Perplexity: procesar más de 800 millones de consultas de usuarios al mes con IA

Perplexity creó pplx-api con las GPU NVIDIA A100 Tensor Core en AWS y NVIDIA TensorRT™-LLM, logrando una latencia hasta 3,1 veces menor y una latencia del primer token 4,3 veces menor en comparación con otras plataformas. La empresa emergente redujo los costes de inferencia a una cuarta parte, lo que ahorró 600 000 dólares anuales, mientras escalaba a cientos de GPU, con las GPU NVIDIA H100 que ofrecen una latencia un 50 % menor y un rendimiento un 200 % mayor que los A100.

Noetik: Potenciando las terapias de cáncer de precisión con el aprendizaje automático

Noetik, miembro del programa NVIDIA Inception, utiliza las GPU NVIDIA Hopper™ Tensor Core en AWS SageMaker HyperPod para entrenar modelos de base multimodales para la inmunoterapia de precisión contra el cáncer. Esto permite el procesamiento de 1 petabyte de datos de tumores humanos, que perfilan más de 200 millones de células, para acelerar los descubrimientos terapéuticos y desbloquear tratamientos adaptados a cada paciente.

Fireworks.ai: inferencia de IA generativa para desarrolladores

Fireworks.ai creó una solución de inferencia de IA generativa ultrarrápida y optimizada en relación con los costes con instancias de Amazon EC2 P5 con la tecnología de las GPU NVIDIA H100 Tensor Core. La plataforma ofrece un rendimiento por instancia cuatro veces superior al de las soluciones de código abierto, reduce la latencia hasta un 50 % y reduce los costes generales hasta cuatro veces para algunos clientes. Los desarrolladores pueden ejecutar, ajustar y personalizar modelos de base, incluidos Llama 2, Stable Diffusion XL y StarCoder, al tiempo que cumplen los estándares de cumplimiento HIPAA y SOC2 Tipo II.

A-Alpha Bio: descubrimiento de fármacos acelerado por IA

A-Alpha Bio aceleró el descubrimiento de fármacos al implementar NVIDIA BioNeMo™ en AWS, logrando una inferencia 12 veces más rápida y procesando 108 millones de predicciones de unión a proteínas, 10 veces más de lo previsto inicialmente. Con instancias de Amazon EC2 P5 impulsadas por las GPU NVIDIA H100 Tensor Core, esta empresa emergente de biotecnología redujo los ciclos experimentales entre 1 y 2 iteraciones, lo que redujo los costos al tiempo que descubría candidatos de anticuerpos monoclonales superiores para terapéutica.

Synthesia: producción de vídeo mejorada por IA

Synthesia transformó la producción de vídeo de IA al implementar instancias de Amazon EC2 con GPU NVIDIA, lo que permitió multiplicar por 30 el rendimiento de entrenamiento de modelos de aprendizaje automático. Con instancias P5 de Amazon EC2 con GPU NVIDIA H100 Tensor Core e instancias P4 con GPU NVIDIA A100, esta empresa emergente de IA redujo el tiempo de entrenamiento de modelos de voz de días a horas, al tiempo que admitió un crecimiento de usuarios del 456 %.

Innophore: mejorar la velocidad, la precisión y la escala en el descubrimiento de fármacos

Innophore acelera el descubrimiento de fármacos con NVIDIA BioNeMo para analizar las estructuras de proteínas con su tecnología Catalophore. La plataforma completó el mapeo de las estructuras de proteínas de todo el organismo humano en dos semanas, una tarea que antes tardaba más de un año. Esto mejora la precisión en la predicción de los efectos de los fármacos fuera del objetivo en un 30 % dentro de los resultados de mejor clasificación.

Infraestructura acelerada de NVIDIA, desde la nube hasta el perímetro, en AWS

Computación en la nube elástica (EC2) de Amazon

Acceda a una amplia gama de instancias aceleradas por GPU de NVIDIA en Amazon EC2 bajo demanda para satisfacer los diversos requisitos computacionales de IA, aprendizaje automático, análisis de datos, gráficos, juegos de la nube, escritorios virtuales y aplicaciones de HPC. Desde instancias de una sola GPU hasta miles de GPU en EC2 UltraClústeres, los clientes de AWS pueden aprovisionar la GPU del tamaño adecuado para acelerar el tiempo de solución y reducir los costes totales de ejecución de sus cargas de trabajo en la nube.

Amazon EC2 P6e con NVIDIA GB300 NVL72

Los servidores Amazon EC2 P6e UltraServers, con sistemas NVIDIA GB300 NVL72, ofrecen un rendimiento de IA sin precedentes. P6e-GB300 proporciona 1,5 veces la memoria de la GPU y computación para modelos de vanguardia, lo que lo hace ideal para entrenar modelos de razonamiento, incluidas arquitecturas de mezcla de expertos (MoE), y para la inferencia de copilotos empresariales y aplicaciones de IA de agentes.

Amazon EC2 P6 con NVIDIA B300

Las instancias P6 de Amazon EC2, con la tecnología de la plataforma NVIDIA Blackwell, ofrecen hasta el doble de mejoras de rendimiento para el entrenamiento y la inferencia de IA. P6-B300 proporciona 1,5 veces más memoria de la GPU y computación en comparación con P6-B200, lo que resulta ideal para el entrenamiento distribuido a gran escala. Perfecto para modelos de MoE a mediana y gran escala y aplicaciones de IA agéntica.

Amazon EC2 G7e con NVIDIA RTX PRO 6000 Blackwell Server Edition

Hay instancias de Amazon EC2 G7e con GPU NVIDIA RTX PRO 6000 Blackwell Server Edition para avanzar en las cargas de trabajo de inferencia de IA, computación científica y computación espacial. Las instancias G7e ofrecen un rendimiento de inferencia hasta 2,3 veces en comparación con las G6e con 1,85 veces de ancho de banda de memoria de la GPU. Basadas en el sistema AWS Nitro para optimizar la gestión de recursos de computación y memoria, las instancias G7e protegen las cargas de trabajo y datos de IA confidenciales.

Integración de AWS con NVLink Fusion

AWS será compatible con NVIDIA NVLink™ Fusion, una plataforma de infraestructura de IA personalizada, que permite la implementación de su silicio diseñado a medida, incluidos chips Trainium4 para la inferencia y el entrenamiento de modelos de IA agentiva, CPU Graviton para una amplia gama de cargas de trabajo e infraestructura de virtualización del sistema Nitro.

AWS y la IA física de NVIDIA

AWS y NVIDIA están profundizando su colaboración para acelerar la IA física, que permite a las máquinas autónomas, como robots y coches autónomos, percibir, comprender, razonar y realizar acciones complejas en el mundo real y físico. Al combinar la infraestructura de nube escalable de AWS con la solución de pila completa de NVIDIA, los desarrolladores pueden entrenar, simular e implementar la IA física de forma más eficiente.

Entrenar con los modelos de NVIDIA Cosmos World Foundation

Disponibles como microservicios NVIDIA NIM en Amazon EKS y AWS Batch, los modelos fundamentales del mundo (WFM) NVIDIA Cosmos™ ayudan a los desarrolladores a crear aplicaciones de IA física que entienden las interacciones físicas complejas. Estos modelos simulan la física y las situaciones del mundo real, lo que permite a los robots razonar sobre su entorno. Son fundamentales para entrenar modelos de base de propósito general para robots humanoides, como NVIDIA GR00T, en la infraestructura de AWS.

Simular con NVIDIA Isaac Lab e Isaac Sim

Los marcos abiertos NVIDIA Isaac™ Lab e Isaac Sim™ ya están disponibles en las instancias G6e de Amazon EC2, lo que ofrece a los equipos una forma escalable de ejecutar aprendizaje y simulación de robots en la nube. Los desarrolladores pueden entrenar políticas en Isaac Lab y validar el comportamiento en Isaac Sim con entornos virtuales físicamente precisos y generación de datos sintéticos antes de implementarlos en robots reales. El flujo de trabajo puede conectarse con AWS para acelerar el entrenamiento de modelos de percepción y el aprendizaje de refuerzo a escala.

Implementar en NVIDIA Jetson Thor

Los módulos de la serie NVIDIA Jetson Thor™ proporcionan la plataforma definitiva para IA física y robótica, proporcionando hasta 2070 TERAFLOPS FP4 de computación de IA y 128 GB de memoria. El superordenador de robótica con tecnología NVIDIA Blackwell habilita cargas de trabajo clave en robótica humanoide, inteligencia espacial, procesamiento multisensor e IA agéntica.

Simplifique el desarrollo y maximice el rendimiento con el software optimizado por NVIDIA

Software optimizado por NVIDIA en AWS

Acceda a la potencia computacional de las instancias aceleradas por GPU de NVIDIA en AWS para desarrollar e implementar sus aplicaciones a escala con menos recursos de computación, acelerando el tiempo de solución y reduciendo el TCO. Para maximizar el rendimiento y la productividad de los desarrolladores, NVIDIA ofrece una amplia gama de software optimizado para GPU para una amplia gama de cargas de trabajo, como ciencia de datos, análisis de datos, entrenamiento de IA y aprendizaje automático, inferencia de IA y aprendizaje automático, HPC y gráficos.

NVIDIA Nemotron Nano 3 en Amazon Bedrock

Amazon Bedrock ya es compatible con el modelo NVIDIA Nemotron™ 3 Nano 30B A3B, el último avance de NVIDIA en modelado de lenguaje eficiente que ofrece un alto rendimiento de razonamiento, compatibilidad nativa de llamada de herramientas y procesamiento de contexto extendido con ventana de contexto de tokens de 256 k. Este modelo emplea una arquitectura de MoE híbrida eficiente para garantizar un rendimiento más alto que sus predecesores para cargas de trabajo de agentes y codificación, al tiempo que mantiene la profundidad de razonamiento de un modelo de mayor tamaño.

NVIDIA AI Enterprise en AWS Marketplace

NVIDIA AI Enterprise es un conjunto de software de IA seguro, de extremo a extremo y nativo de la nube. Acelera las canalizaciones de la ciencia de datos y optimiza el desarrollo, la implementación y la gestión de modelos predictivos de IA para automatizar procesos esenciales y ofrecer información rápida a partir de los datos. NVIDIA AI Enterprise incluye una extensa biblioteca de software de pila completa, que incluye flujos de trabajo de IA de NVIDIA, frameworks, modelos preentrenados y optimización de infraestructura. El soporte empresarial global y las revisiones periódicas de seguridad garantizan la continuidad del negocio y que los proyectos de IA sigan el buen camino.

NVIDIA Run:ai en AWS Marketplace

NVIDIA Run:ai simplifica la gestión de la infraestructura de IA para las organizaciones al proporcionar un plano de control para la infraestructura de GPU en entornos nativos de Kubernetes. La plataforma aborda la utilización de la GPU, la priorización de la carga de trabajo y la visibilidad del consumo de la GPU al introducir un grupo de GPU virtual y permitir una programación dinámica y basada en políticas. NVIDIA Run:ai se integra con varios servicios de AWS, como Amazon EC2, EKS, SageMaker HyperPod, IAM y CloudWatch para optimizar el rendimiento, simplificar las operaciones y proporcionar una base unificada para las cargas de trabajo de IA/ML.

Servicios de AWS acelerados por NVIDIA

NVIDIA y AWS colaboran estrechamente en integraciones para llevar la potencia de la computación acelerada por NVIDIA a una amplia gama de servicios de AWS. Tanto si aprovisiona y gestiona usted mismo las instancias aceleradas por GPU de NVIDIA en AWS como si las aprovecha en servicios gestionados como Amazon SageMaker o Amazon Elastic Kubernetes Service (EKS), tiene la flexibilidad de elegir el nivel óptimo de abstracción que necesita.

Amazon EMR

Aproveche el NVIDIA RAPIDS™ Accelerator para Apache Spark dentro de Amazon EMR para acelerar las canalizaciones de ciencia de datos de Apache Spark 3.x sin ningún cambio de código en instancias de AWS aceleradas por GPU de NVIDIA. Esta integración permite a los científicos de datos ejecutar canalizaciones de extracción, transformación y carga (ETL), procesamiento de datos y aprendizaje automático a escala masiva y reducir los costes en la nube al hacer más en menos tiempo y con menos instancias basadas en la nube.

Amazon SageMaker AI

El software de IA de NVIDIA y las instancias aceleradas por GPU pueden acelerar cada paso de los flujos de trabajo de IA y aprendizaje automático en Amazon Sagemaker, incluida la preparación de datos, el entrenamiento de modelos y el servicio de inferencia. Para implementar modelos de IA en la producción más rápido y reducir los costes de inferencia, Amazon SageMaker ha integrado NVIDIA Triton Inference Server™, lo que habilita características como compatibilidad con varios marcos, lotes dinámicos y ejecución concurrente de modelos que maximizan el rendimiento en instancias de CPU y GPU en AWS.

Amazon Bedrock con Mantle

Amazon Bedrock permite a empresas y startups desarrollar aplicaciones de IA con agencia a escala de producción. La plataforma incluye modelos NVIDIA Nemotron disponibles directamente en el catálogo de modelos de Amazon Bedrock, microservicios NVIDIA NIM en Amazon Bedrock Marketplace y SageMaker Jumpstart, conjunto de herramientas NVIDIA NeMo Agent integrado con Amazon Bedrock AgentCore para servicios componibles y dirigidos por agentes, e inferencia vectorial sin servidor acelerada por GPU.

Recursos para desarrolladores y guías de inicio rápido

Programa para desarrolladores de NVIDIA

Acceda a un espacio en línea dedicado a sus necesidades, que incluye herramientas de software avanzadas, documentación técnica, recursos de aprendizaje y ayuda de expertos entre colegas y en el ámbito para acelerar su trabajo en IA.

NVIDIA Deep Learning Institute (DLI)

Desarrolle y domine las habilidades que necesita para avanzar en sus conocimientos en IA, computación acelerada, ciencia de datos, gráficos, simulación y mucho más con cursos prácticos y formación impartida por expertos.

NVIDIA Inception para empresas emergentes

Únase a este programa gratuito diseñado para ayudar a las empresas emergentes de IA a evolucionar más rápido con tecnología avanzada, oportunidades de conectar con inversores y acceso a las herramientas más recientes para desarrolladores y recursos técnicos de NVIDIA.

Accede a la potencia de AWS y NVIDIA

Instancias de Amazon EC2

NVIDIA AI Enterprise

Modelos de NVIDIA Nemotron en AWS