Acelere la Innovación en la Nube

Diagnóstico de cáncer. Predecir huracanes. Automatización de operaciones comerciales. Estos son algunos de los avances posibles cuando se utiliza la computación acelerada para revelar los conocimientos que se esconden en grandes volúmenes de datos. Amazon Web Services (AWS) y NVIDIA han colaborado durante más de 13 años para ofrecer la nube acelerada por GPU más potente y avanzada para ayudar a los clientes a construir un futuro más inteligente.

Impulse Nuevas Capacidades con AWS y NVIDIA

Área de la Salud

Ofrezca medicina personalizada y acelere los avances en la investigación biomédica con las soluciones de AWS y NVIDIA.

Medios y Entretenimiento

Descubra el potencial de la computación en la nube para la creación de contenidos digitales. Adapta tus recursos a medida que crecen las demandas de tu estudio y accede al mejor talento creativo a traves del globo.

Servicios Financieros

Impulse la gestión de riesgos, mejore las decisiones y la seguridad basadas en datos y mejore las experiencias de los clientes con soluciones de IA generativa, deep learning, machine learning y procesamiento del lenguaje natural (NLP) .

Gemelos Digitales y Metaverso

Aproveche el poder de la simulación a gran escala para aplicaciones industriales y científicas.

IA Generativa y Machine Learning

Reduzca el tiempo de desarrollo, reduzca los costos, mejore la precisión y el rendimiento y tenga más confianza en los resultados de la IA con las soluciones de NVIDIA que se ejecutan en AWS.

Computación de Alto Rendimiento

Descubra cómo las soluciones de computación de alto rendimiento (HPC) de AWS y NVIDIA se optimizan para trabajar juntas y resolver de manera rentable los problemas más complejos del mundo.

Explorar Historias de Clientes

Transcripción de Videollamadas

La empresa de software Read.ai creó su plataforma de transcripción de videollamadas en NVIDIA® Riva y redujo los costos entre un 20 y un 30 por ciento utilizando instancias Amazon EC2 G5 con tecnología de GPU NVIDIA A10G Tensor Core.

Machine Learning en Ciencias Biológicas

La empresa de ciencias biológicas Paige está avanzando en el tratamiento del cáncer con un workflow de machine learning híbrido creado con instancias Amazon EC2 P4d con tecnología de GPU NVIDIA A100 Tensor Core.

Estudio de Efectos Visuales en la Nube

Netflix implementó su estudio de efectos visuales (VFX) para facilitar la colaboración remota entre un equipo global utilizando instancias Amazon EC2 G5 con tecnología de GPU NVIDIA A10G.

IA Generativa para Contenido

Iternal Technologies utilizó instancias Amazon EC2 con tecnología de GPU NVIDIA para ayudar a sus clientes a potenciar su marketing, mejorando el ROI 30 veces con IA generativa. Debido a que Iternal es parte de NVIDIA Inception, estuvieron entre los primeros en obtener acceso a las capacidades de clonación de voz de NVIDIA Riva para poner en funcionamiento un producto de voz de IA generativa de prueba de concepto en dos semanas

 

 

HPC y Machine Learning para el Comercio Minorista

Reezocar, una empresa de automóviles, calcula las reparaciones de vehículos de forma rápida y precisa utilizando AWS HPC y una infraestructura de machine learning impulsada por GPU NVIDIA. Con esta infraestructura, la empresa puede detectar meticulosamente abolladuras e imperfecciones en los automóviles y estimar los costos de reparación en milisegundos, lo que ayuda a extender la vida útil de los vehículos.

IA Generativa para Games

Codeway optimizó el rendimiento de precios para su aplicación de IA generativa, Wonder, utilizando instancias Amazon EC2 G5 con tecnología de GPU NVIDIA, ahorrando un 48 por ciento en costos de computación.

Infraestructura Acelerada de NVIDIA, Desde la Nube Hasta el Edge, en AWS

Computación en la Nube Elástica de Amazon (EC2)

Acceda a una amplia gama de instancias aceleradas por GPU NVIDIA en Amazon EC2 bajo demanda para cumplir con los diversos requisitos computacionales de IA, machine learning, análisis de datos, gráficos, games en la nube, escritorios virtuales y aplicaciones HPC. Desde instancias de una sola GPU hasta miles de GPU en EC2 UltraClusters, los clientes de AWS pueden aprovisionar la GPU del tamaño adecuado para acelerar el tiempo de solución y reducir los costos totales de ejecutar sus cargas de trabajo en la nube.

Amazon EC2 G5 con NVIDIA A10G

Con GPU NVIDIA A10G Tensor Core y compatibilidad con la tecnología NVIDIA RTX™, las instancias EC2 G5 son ideales para aplicaciones con uso intensivo de gráficos, como edición de video, renderizado, visualización 3D y simulaciones fotorrealistas. Además, se pueden utilizar para acelerar la inferencia de IA y las cargas de trabajo de entrenamiento de IA con una sola GPU.

 

Amazon EC2 G5g con NVIDIA T4G

Con GPU NVIDIA T4G Tensor Core y procesadores AWS Graviton2, las instancias EC2 G5g son las más adecuadas para el desarrollo de games en la nube y servicios de games Android en la nube. También se pueden utilizar para realizar inferencias de IA rentables utilizando el software compatible con Arm® del catálogo NVIDIA NGC™.

Amazon EC2 P4d con NVIDIA A100 40GB

Con ocho GPU NVIDIA A100 Tensor Core de 40GB, las instancias EC2 P4d ofrecen el mayor rendimiento para IA y HPC. Para entrenamiento de IA de múltiples nodos y cargas de trabajo de HPC distribuidas, puede escalar desde unas pocas hasta miles de GPU NVIDIA A100 en EC2 UltraClusters.

Amazon EC2 P5 con NVIDIA H100 80GB

Las GPU Tensor Core ofrecen el mayor rendimiento en Amazon EC2 para aplicaciones de HPC y deep learning. Le ayudan a acelerar el tiempo de solución hasta 6 veces en comparación con las instancias EC2 basadas en GPU de la generación anterior y reducen el costo de entrenar modelos de machine learning hasta en un 40 por ciento.

Ofertas de Edge y Nube Híbrida de AWS

Aproveche el poder de la computación acelerada por NVIDIA en una amplia gama de soluciones en el edge y de nube híbrida de AWS para cumplir con los requisitos de baja latencia y en tiempo real de cargas de trabajo como IA, machine learning, games, creación de contenido y realidad aumentada (AR). Transmisión de realidad virtual (VR). La pila de software nativa de la nube y con rendimiento optimizado de NVIDIA garantiza que usted obtenga el mejor rendimiento para sus aplicaciones, dondequiera que necesiten ejecutarse: desde la nube hasta el edge.

AWS Panorama

AWS Panorama es una colección de dispositivos de machine learning y un SDK que brinda visión por computadora a cámaras de protocolo de Internet (IP) locales. Los dispositivos en el edge de AWS Panorama están integrados en el sistema NVIDIA Jetson™ en módulos (SOM) y utilice el SDK SDK NVIDIA JetPack™ para acelerar la IA en el edge para casos de uso de inspección industrial, monitoreo del tráfico y gestión de la cadena de suministro.

AWS Outposts

Con las GPU NVIDIA T4 Tensor Core en AWS Outposts, puede cumplir con los requisitos de seguridad y latencia en una amplia variedad de aplicaciones de gráficos e IA en data center locales. Combinado con el acceso al software optimizado para GPU de NGC, puede obtener información a partir de grandes cantidades de datos en órdenes de magnitud más rápido que solo con las CPU.

AWS Wavelength

AWS Wavelength lleva la nube de AWS al edge de la red móvil 5G para desarrollar e implementar aplicaciones de latencia ultrabaja. Las zonas de AWS Wavelength ofrecen acceso a instancias aceleradas por GPU de NVIDIA para acelerar aplicaciones como la transmisión de games, AR/VR e inferencia de IA en el edge.

AWS IoT Greengrass

AWS IoT Greengrass extiende los servicios de AWS a dispositivos en el edge, como las plataformas NVIDIA Jetson, para desarrollar modelos de IA e implementarlos en el edge para actuar localmente sobre los datos generados. En combinación con el SDK NVIDIA DeepStream, puede crear e implementar aplicaciones de IA de visión de alto rendimiento y baja latencia en el edge.

 

Simplifique el Desarrollo y Maximice el Rendimiento con el Software Optimizado por NVIDIA

Software Optimizado para NVIDIA en AWS

Acceda al poder computacional de las instancias aceleradas por GPU de NVIDIA en AWS para desarrollar e implementar sus aplicaciones a escala con menos recursos de computación, acelerando el tiempo de solución y reduciendo el TCO. Para maximizar el rendimiento y la productividad de los desarrolladores, NVIDIA ofrece una amplia gama de software optimizado para GPU para una amplia gama de cargas de trabajo, incluida ciencia de datos, análisis de datos, capacitación en IA y machine learning, inferencia de IA y machine learning, HPC y gráficos.

NVIDIA NGC

NVIDIA NGC es el portal de servicios empresariales, software, herramientas de gestión y soporte para workflows de gemelos digitales e IA de extremo a extremo. El catálogo de software de NGC proporciona una variedad de recursos que satisfacen las necesidades de científicos, desarrolladores e investigadores de datos con distintos niveles de experiencia, incluidos contenedores, modelos previamente entrenados, SDK de dominios específicos, colecciones basadas en casos de uso y gráficos Helm para la solución más rápida. Implementaciones de IA. Para llevar cargas de trabajo de IA a producción con el software NGC, puede acceder a soporte, capacitación y servicios de nivel empresarial con NVIDIA AI Enterprise.

NVIDIA AI Enterprise en AWS

NVIDIA AI Enterprise es un conjunto de software de IA seguro, de extremo a extremo y nativo de la nube. Acelera los procesos de ciencia de datos y agiliza el desarrollo, la implementación y la gestión de modelos predictivos de IA para automatizar procesos esenciales y ofrecer información rápida a partir de los datos. NVIDIA AI Enterprise incluye una extensa biblioteca de software completo, que incluye workflows de IA de NVIDIA, frameworks, modelos previamente entrenados y optimización de infraestructura. El soporte empresarial global y las revisiones periódicas de seguridad garantizan la continuidad del negocio y que los proyectos de IA se mantengan encaminados.

Workstation Virtual NVIDIA RTX

La workstation virtual NVIDIA RTX (RTX vWS) para gráficos acelerados por GPU ayuda a los profesionales creativos y técnicos a maximizar su productividad desde cualquier lugar al brindarles acceso a las aplicaciones profesionales de diseño e ingeniería más exigentes desde la nube. Instancias Amazon EC2 G5 (NVIDIA A10G) y G4dn (NVIDIA T4), combinadas con la Imagen de máquina de Amazon RTX vWS (AMI), habilita la plataforma de gráficos 3D más avanzada de la industria, incluido el último ray tracing en tiempo real con tecnología RTX en máquinas virtuales.

Servicios de AWS Acelerados por NVIDIA

NVIDIA y AWS colaboran estrechamente en integraciones para llevar el poder de la computación acelerada por NVIDIA a una amplia gama de servicios de AWS. Ya sea que usted mismo aprovisione y administre las instancias aceleradas por GPU de NVIDIA en AWS o las aproveche en servicios administrados como Amazon SageMaker o Amazon Elastic Kubernetes Service (EKS), tiene la flexibilidad de elegir el nivel óptimo de abstracción que necesita.

Amazon EMR

Aproveche el acelerador NVIDIA RAPIDS™ para Apache Spark dentro de Amazon EMR para acelerar los procesos de ciencia de datos de Apache Spark 3.x sin ningún cambio de código en instancias de AWS aceleradas por GPU NVIDIA. Esta integración permite a los científicos de datos ejecutar sus procesos de extracción, transformación y carga (ETL), procesamiento de datos y machine learning a escala masiva y reducir los costos de la nube al hacer más en menos tiempo y con menos instancias basadas en la nube.

Amazon SageMaker

El software de IA de NVIDIA y las instancias aceleradas por GPU pueden acelerar cada paso de los workflows de IA y machine learning dentro de Amazon Sagemaker, incluida la preparación de datos, el entrenamiento de modelos y el servicio de inferencia. Para implementar modelos de IA en producción más rápidamente y reducir los costos de inferencia, Amazon SageMaker ha integrado el Servidor de Inferencia NVIDIA Triton™ . habilitando características como soporte de múltiples frameworks, procesamiento por lotes dinámico y ejecución simultánea de modelos que maximizan el rendimiento en instancias de CPU y GPU en AWS.

Amazon Titan

Un equipo de científicos y desarrolladores experimentados de AWS crean los modelos básicos de Amazon Titan para Amazon Bedrock, un servicio de IA generativa, utilizan NVIDIA NeMo™, un framework nativo de la nube de extremo a extremo para crear, personalizar e implementar modelos de IA generativa en cualquier lugar.

Y el Elastic Fabric Adapter (EFA) de AWS proporciona a los clientes una infraestructura de red UltraCluster que puede conectar directamente más de 10 000 GPU y evitar el sistema operativo y la CPU mediante NVIDIA GPUDirect®.

Recursos para Desarrolladores y Guías de Inicio Rápido

Talleres de Etiquetas MONAI

Descubra cómo puede utilizar MONAI, un framework de IA de código abierto para el área de la salud, en su trabajo. Únase a nosotros para obtener una experiencia práctica.

BioNeMo Ahora en AWS

Los investigadores y desarrolladores de las principales empresas farmacéuticas y tecnológicas ahora pueden implementar fácilmente software y servicios NVIDIA Clara™, incluido NVIDIA BioNeMo™, para el área de la salud acelerada a través de AWS.

Acelere Su Startup

Explore el programa que brinda a las starturs de todo el mundo acceso fundamental a soporte de comercialización, experiencia técnica, capacitación y oportunidades de financiamiento.

Capacidades de IA Usando TensorRT-LLM

Anteriormente, crear listados de productos detallados requería mucho tiempo y esfuerzo por parte de los vendedores, pero este proceso simplificado les da más tiempo para concentrarse en otras tareas. El software NVIDIA TensorRT-LLM está disponible hoy en GitHub y se puede acceder a él a través de NVIDIA AI Enterprise, que ofrece seguridad, soporte y confiabilidad de nivel empresarial para la IA de producción.

NVIDIA CloudXR

NVIDIA CloudXR™ es la tecnología de transmisión de realidad extendida (XR) de NVIDIA, basada en el software RTX y RTX Virtual Workstation. Al utilizar CloudXR junto con los protocolos de transmisión Amazon NICE DCV, puede utilizar recursos de computación bajo demanda para todos los aspectos del desarrollo de aplicaciones inmersivas.

Servidor de Inferencia NVIDIA Triton en Amazon SageMaker

Este blog proporciona una descripción general del Servidor de Inferencia NVIDIA Triton y SageMaker, muestra los beneficios de usar contenedores del Servidor de Inferencia Triton y muestra lo fácil que es implementar sus propios modelos de machine learning. Para trabajar desde un cuaderno de muestra que admita esta publicación de blog, descárguelo aquí .

 

NVIDIA Riva a Escala con Amazon EKS

Esta guía paso a paso le muestra cómo implementar y escalar las habilidades de voz de NVIDIA Riva en Amazon EKS con el equilibrio de carga basado en Traefik.

Amazon Music Utiliza SageMaker con NVIDIA para Optimizar la Inferencia y el Entrenamiento del Machine Learning

Eche un vistazo al recorrido que realizó Amazon Music para optimizar el rendimiento y los costos utilizando SageMaker, el Servidor de Inferencia NVIDIA Triton y NVIDIA TensorRT. Mostramos cómo funciona la barra de búsqueda aparentemente simple, pero intrincada, que garantiza una experiencia fluida en Amazon Music con retrasos tipográficos mínimos o nulos y resultados de búsqueda relevantes en tiempo real.

Amazon Acelera la Satisfacción del Cliente con NVIDIA Triton y TensorRT

Amazon.com, uno de los sitios web de comercio electrónico más visitados del mundo, utiliza un modelo de IA que corrige automáticamente las palabras mal escritas en las consultas de búsqueda para permitir a los clientes comprar con mayor facilidad. Amazon mide el éxito de sus resultados de búsqueda acelerados en función de la latencia (qué tan rápido se corrigen los errores tipográficos) y la cantidad de sesiones exitosas.

Acceda al Poder de AWS y NVIDIA

Instancias P5 de Amazon EC2

NVIDIA AI Enterprise

Workstations Virtuales NVIDIA RTX