Acelere a Inovação na Cloud

Diagnóstico de câncer. Previsão de furacões. Automatização de operações empresariais. Esses são alguns dos avanços possíveis quando você usa a computação acelerada para revelar os insights ocultos em vastos volumes de dados. Amazon Web Services (AWS) e NVIDIA colaboram desde 2010 para oferecer Cloud acelerada por GPU altamente potente, para ajudar os clientes a criar um futuro mais inteligente.

Anunciadas no GTC 2026, várias novas parcerias que se expandem do processamento de dados com tecnologia da NVIDIA na AWS até a família de modelos NVIDIA Nemotron™ continuam oferecendo inovação full-stack. Leia os anúncios aqui.

Potencialize novos recursos com a AWS e a NVIDIA

Área da saúde

Forneça medicamentos personalizados e acelere avanços em pesquisas biomédicas com soluções da AWS e NVIDIA.

Mídia e Entretenimento

Conheça o potencial da computação em nuvem para a criação de conteúdo digital. Adapte seus recursos à medida que as demandas do seu estúdio crescem e acesse os melhores talentos criativos em todo o mundo.

Serviços financeiros

Aprimore o gerenciamento de riscos, melhore as decisões e a segurança baseadas em dados e aprimore as experiências dos clientes com soluções de IA generativa, deep learning, machine learning e processamento de linguagem natural (PNL).

Gêmeos digitais e Metaverso

Aproveite o poder da simulação em larga escala para aplicações industriais e científicas.

IA Generativa e Machine Learning

Reduza o tempo de desenvolvimento, reduza os custos, melhore a precisão e o desempenho e tenha mais confiança nos resultados de IA com soluções da NVIDIA executadas na AWS.

Computação de alto desempenho

Saiba como as soluções de computação de alto desempenho (HPC) da AWS e da NVIDIA são otimizadas para funcionar juntas, resolvendo de maneira econômica os problemas mais complexos do mundo.

 

Explore histórias de clientes

Transcrição de videochamada

A empresa de software Read.ai construiu sua plataforma de transcrição de videochamadas no NVIDIA® Riva e reduziu os custos em 20 a 30 por cento usando instâncias Amazon EC2 G5 com tecnologia de GPUs NVIDIA A10G Tensor Core.

Machine Learning em ciências biológicas

A empresa de ciências biológicas Paige está promovendo o tratamento do câncer com um workflow de machine learning híbrido criado usando instâncias P4d do Amazon EC2 com tecnologia de GPUs NVIDIA A100 Tensor Core.

Estúdio de efeitos visuais em nuvem

A Netflix implantou seu estúdio de efeitos visuais (VFX) para facilitar a colaboração remota entre uma equipe global usando instâncias do Amazon EC2 G5 com tecnologia de GPUs NVIDIA A10G.

IA Generativa para conteúdo

A Iternal Technologies usou instâncias do Amazon EC2 com GPUs NVIDIA para ajudar seus clientes a turbinar seu marketing, melhorando o ROI em 30 vezes com IA generativa. Como a Iternal faz parte do NVIDIA Inception, ela foi uma das primeiras a obter acesso aos recursos de clonagem de voz do NVIDIA Riva para colocar um produto de voz de IA generativa de prova de conceito em funcionamento em duas semanas.

HPC e Machine Learning para varejo

A empresa automotiva Reezocar estima reparos de veículos com rapidez e precisão usando o AWS HPC e infraestrutura de Machine Learning com GPUs NVIDIA. Com essa infraestrutura, a empresa pode detectar meticulosamente amassados e imperfeições nos automóveis e estimar os custos de reparo em milissegundos, ajudando a prolongar a vida útil dos veículos.

IA Generativa para games

A Codeway otimizou o desempenho de preço para sua aplicação de IA generativa, Wonder, usando instâncias do Amazon EC2 G5 com GPU NVIDIA, economizando 48% em custos de computação.

Infraestrutura acelerada da NVIDIA, da nuvem ao edge, na AWS

Computação Elastic Cloud da Amazon (EC2)

Acesse uma ampla variedade de instâncias aceleradas por GPU NVIDIA no Amazon EC2 sob demanda para atender aos diversos requisitos computacionais de IA, machine learning, análise de dados, gráficos, games na nuvem, desktops virtuais e aplicações de HPC. Desde instâncias de GPU única até milhares de GPUs no EC2 UltraClusters, os clientes da AWS podem montar a GPU do tamanho certo para acelerar o tempo de solução e reduzir os custos totais de execução de suas cargas de trabalho em nuvem.

Amazon EC2 G5 com NVIDIA A10G

Apresentando GPUs NVIDIA A10G Tensor Core e suporte para a tecnologia NVIDIA RTX™, as instâncias EC2 G5 são ideais para aplicações com uso intensivo de gráficos, como edição de vídeo, renderização, visualização 3D e simulações fotorrealistas. Além disso, eles podem ser usados para acelerar a inferência de IA e cargas de trabalho de treinamento de IA com GPU única.

 

Amazon EC2 G5g com NVIDIA T4G

Apresentando GPUs NVIDIA T4G Tensor Core e processadores AWS Graviton2, as instâncias EC2 G5g são mais adequadas para desenvolvimento de games em nuvem e serviços de games Android em nuvem. Eles também podem ser usados para inferência de IA econômica usando software habilitado para Arm® do catálogo NVIDIA NGC™

 

Amazon EC2 P4d com NVIDIA A100 40GB

Apresentando oito GPUs Tensor Core NVIDIA A100 de 40GB, as instâncias EC2 P4d oferecem o mais alto desempenho para IA e HPC. Para treinamento de IA de vários nós e cargas de trabalho de HPC distribuídas, você pode dimensionar de poucas a milhares de GPUs NVIDIA A100 em EC2 UltraClusters.

Amazon EC2 P5 com NVIDIA H100 80 GB

As GPUs Tensor Core oferecem o mais alto desempenho no Amazon EC2 para deep learning e aplicações de HPC. Eles ajudam você a acelerar o tempo de solução em até 6 vezes, em comparação com as instâncias EC2 baseadas em GPU da geração anterior, e a reduzir o custo de treinamento de modelos de machine learning em até 40%.

Soluções de Nuvem Híbrida e Edge da AWS

Aproveite o poder da computação acelerada pela NVIDIA em uma ampla variedade de soluções de edge e nuvem híbrida da AWS, para atender aos requisitos de baixa latência e em tempo real de cargas de trabalho com IA, machine learning, games, criação de conteúdo e realidade aumentada (AR) e streaming de realidade virtual (VR). O stack de software nativo em nuvem e com desempenho otimizado da NVIDIA garante que você obtenha o melhor desempenho para suas aplicações, onde quer que elas precisem ser executadas, da nuvem até o edge.

AWS Panorama

AWS Panorama é uma coleção de dispositivos de machine learning e um SDK que leva visão computacional para câmeras de protocolo de internet (IP) locais. Os dispositivos no edge do AWS Panorama são criados no sistema NVIDIA Jetson™ em módulos (SOM) e usam o SDK NVIDIA JetPack para acelerar a IA de Edge para casos de uso de inspeção industrial, monitoramento de tráfego e gerenciamento da cadeia de suprimentos.

AWS Outposts

Com as GPUs NVIDIA T4 Tensor Core no AWS Outposts, você pode atender aos requisitos de segurança e latência em uma ampla variedade de aplicações gráficas e de IA em data centers locais. Combinado com o acesso ao software otimizado para GPU do NGC, você pode obter insights de grandes quantidades, em diversas ordens de magnitude de dados, mais rapidamente do que apenas CPUs.

AWS Wavelength

AWS Wavelength leva a nuvem AWS até o edge da rede móvel 5G para desenvolver e implantar aplicações de latência ultrabaixa. As zonas do AWS Wavelength oferecem acesso a instâncias aceleradas por GPU NVIDIA para acelerar aplicações como streaming de games, AR/VR e inferência de IA no edge.

AWS IoT Greengrass

O AWS IoT Greengrass estende os serviços da AWS para dispositivos no edge, como plataformas NVIDIA Jetson, para desenvolver modelos de IA e implantá-los no edge para agir localmente nos dados gerados. Em combinação com o SDK NVIDIA DeepStream, você pode criar e implantar aplicações de IA de visão de alto rendimento e baixa latência no edge.

Simplifique o desenvolvimento e maximize o desempenho com software otimizado para NVIDIA

Software otimizado para NVIDIA na AWS

Acesse o poder computacional das instâncias aceleradas por GPU NVIDIA na AWS para desenvolver e implantar suas aplicações em escala com menos recursos computacionais, acelerando o tempo de solução e reduzindo o TCO. Para maximizar o desempenho e a produtividade do desenvolvedor, a NVIDIA oferece uma ampla variedade de software otimizado para GPU para uma ampla variedade de cargas de trabalho, incluindo ciência de dados, análise de dados, treinamento em IA e Machine Learning, inferência de IA e Machine Learning, HPC e gráficos.

NVIDIA NGC

O NVIDIA NGC é o portal de serviços empresariais, software, ferramentas de gerenciamento e suporte para IA ponta a ponta e workflows de gêmeos digitais. O catálogo de software do NGC fornece uma variedade de recursos que atendem às necessidades de cientistas de dados, desenvolvedores e pesquisadores com diversos níveis de especialização, incluindo contêineres, modelos pré-treinados, SDKs específicos de domínio, coleções baseadas em casos de uso e gráficos Helm para as implementações mais rápidas. Para levar cargas de trabalho de IA para produção com o software NGC, você pode acessar suporte, treinamento e serviços de nível empresarial com o NVIDIA AI Enterprise.

NVIDIA AI Enterprise na AWS

O NVIDIA AI Enterprise é um pacote de software de IA seguro, completo e nativo em nuvem. Ele acelera os pipelines de ciência de dados e agiliza o desenvolvimento, a implantação e o gerenciamento de modelos preditivos de IA para automatizar processos essenciais e fornecer insights rápidos a partir dos dados. O NVIDIA AI Enterprise inclui uma extensa biblioteca de software full-stack, incluindo workflows de IA da NVIDIA, frameworks, modelos pré-treinados e otimização de infraestrutura. O suporte empresarial global e as revisões regulares de segurança garantem a continuidade dos negócios e que os projetos de IA permaneçam no caminho certo.

Workstation virtual NVIDIA RTX

A Workstation virtual NVIDIA RTX (RTX vWS) para gráficos acelerados por GPU ajuda profissionais criativos e técnicos a maximizar sua produtividade em qualquer lugar, fornecendo acesso às aplicações profissionais de design e engenharia mais exigentes em nuvem. As instâncias Amazon EC2 G5 (NVIDIA A10G) e G4dn (NVIDIA T4), combinadas com a imagem de máquina Amazon RTX vWS (AMI), permitem a plataforma gráfica 3D mais avançada do setor, incluindo o mais recente ray tracing em tempo real com tecnologia RTX em máquinas virtuais.

Serviços da AWS acelerados pela NVIDIA

A NVIDIA e a AWS colaboram em integrações para trazer o poder da computação acelerada da NVIDIA para uma ampla variedade de serviços da AWS. Se você fornece e gerencia instâncias aceleradas por GPU da NVIDIA na AWS ou as utiliza em serviços gerenciados, como o Amazon SageMaker ou o Amazon Elastic Kubernetes Service (EKS), você tem a flexibilidade para escolher o nível ideal de abstração de que precisa.

Amazon EMR

Aproveite o acelerador NVIDIA RAPIDS™ para Apache Spark no Amazon EMR para acelerar pipelines de ciência de dados do Apache Spark 3.x sem nenhuma alteração de código em instâncias da AWS aceleradas por GPU NVIDIA. Essa integração permite que os cientistas de dados executem seus pipelines de extração, transformação e carregamento (ETL), processamento de dados e machine learning em larga escala e reduzam os custos de nuvem, fazendo mais em menos tempo e com menos instâncias baseadas em nuvem.

Amazon SageMaker

O software de IA da NVIDIA e as instâncias aceleradas por GPU podem acelerar cada etapa dos workflows de Machine Learning no Amazon Sagemaker, incluindo preparação de dados, treinamento de modelos e serviço de inferência. Para implantar modelos de IA na produção com mais rapidez e reduzir custos de inferência, o Amazon SageMaker integrou o Servidor de inferência NVIDIA Triton™, habilitando recursos como suporte a múltiplos frameworks, lote dinâmico e execução de modelos simultâneos que maximizam o desempenho em instâncias de CPU e GPU na AWS.

Amazon Titan

Uma equipe de cientistas e desenvolvedores experientes da AWS criou os modelos básicos do Amazon Titan para o Amazon Bedrock, um serviço de IA generativa. Eles usam o NVIDIA NeMo™, um framework nativo da nuvem de ponta a ponta para criar, personalizar e implantar modelos de IA generativa em qualquer lugar.

E o Elastic Fabric Adapter (EFA) da AWS oferece aos clientes uma infraestrutura de rede UltraCluster que pode conectar diretamente mais de 10 mil GPUs e ignorar o sistema operacional e a CPU usando o NVIDIA GPUDirect® .

Recursos para desenvolvedores e guias rápidos

Workshops de rótulos MONAI

Saiba como você pode usar o MONAI, um framework de IA de código aberto para área da saúde, em seu trabalho. Junte-se a nós para ter uma experiência prática.

BioNeMo agora na AWS

Pesquisadores e desenvolvedores das principais empresas farmacêuticas e tecnológicas agora podem implantar facilmente o software e serviços NVIDIA Clara™, incluindo o NVIDIA BioNeMo™, para área da saúde, com suporte AWS.

Acelere sua startup

 

Explore o programa que oferece suporte de entrada no mercado para startups de todo o mundo, além de conhecimento técnico, treinamento e oportunidades de financiamento.

Recursos de IA usando o TensorRT -LLM

Anteriormente, a criação de listas de produtos detalhadas exigia tempo e esforço significativos para os vendedores, mas esse processo simplificado lhes dá mais tempo para se concentrarem em outras tarefas. O software NVIDIA TensorRT-LLM está disponível hoje no GitHub e pode ser acessado por meio do NVIDIA AI Enterprise, que oferece segurança, suporte e confiabilidade de nível empresarial para IA de produção.

NVIDIA CloudXR

O NVIDIA CloudXR ™ é a tecnologia de streaming de realidade estendida (XR) da NVIDIA, baseada no software RTX e RTX Virtual Workstation. Ao usar o CloudXR junto com os protocolos de streaming do Amazon NICE DCV, você pode usar recursos de computação sob demanda para todos os aspectos do desenvolvimento de aplicações imersivas.

Servidor de inferência NVIDIA Triton no Amazon SageMaker

Este blog fornece uma visão geral do Servidor de Inferência NVIDIA Triton e do SageMaker, mostra as vantagens do uso de contêineres do Servidor de Inferência Triton e mostra como é fácil implantar seus próprios modelos de Machine Learning. Para trabalhar a partir de um bloco de notas de amostra que suporte esta postagem do blog, faça o download aqui.

NVIDIA Riva em escala com Amazon EKS

Este guia passo a passo mostra como implantar e dimensionar habilidades de fala do NVIDIA Riva no Amazon EKS com balanceamento de carga baseado em Traefik.

Amazon Music usa SageMaker com NVIDIA para otimizar treinamento e inferência de machine learning

Dê uma olhada na jornada que a Amazon Music percorreu para otimizar desempenho e custos usando o SageMaker, o servidor de inferência NVIDIA Triton e o NVIDIA TensorRT®. Mostramos como funciona a barra de pesquisa aparentemente simples, mas complexa, garantindo uma experiência perfeita no Amazon Music com atrasos de digitação mínimos, ou zero, e resultados de pesquisa relevantes em tempo real.

Amazon agrada clientes com o NVIDIA Triton e TensorRT

A Amazon.com, um dos sites de comércio eletrônico mais visitados do mundo, usa um modelo de IA que corrige automaticamente palavras com erros ortográficos em consultas de pesquisa para permitir que os clientes comprem com mais facilidade. A Amazon mede o sucesso de seus resultados de pesquisa acelerados com base em latência, rapidez de correção de erros de digitação e número de sessões bem-sucedidas.

Acesse o poder da AWS e da NVIDIA

Instâncias P5 do Amazon EC2

NVIDIA AI Enterprise

Workstations virtuais NVIDIA RTX