Este workshop aborda as ferramentas e técnicas fundamentais para executar aplicações em Python aceleradas por GPU usando GPUs CUDA® e o compilador Numba.

 

Objetivos de Aprendizagem
 

Ao final do workshop, você terá conhecimento das ferramentas e técnicas fundamentais para aplicações em Python aceleradas por GPU com CUDA e Numba:
  • Acelerar NumPy ufuncs com GPU e algumas linhas de código.
  • Configurar a paralelização do código usando a hierarquia de threads da CUDA.
  • Escrever kernels de dispositivos CUDA personalizados para o máximo desempenho e flexibilidade.
  • Usar memória coalescente e memória compartilhada no dispositivo para aumentar a largura de banda de kernel da CUDA.

Faça download do datasheet do workshop (PDF de 67KB)

Resumo do Workshop

Introdução
(15 minutos)
  • Conhecer o instrutor.
  • Criar uma conta em courses.nvidia.com/join
Introdução ao CUDA Python com Numba
(120 minutos)
  • Começar a trabalhar com compilador Numba e programação CUDA em Python.
  • Usar decoradores Numba para acelerar funções numéricas em Python por GPU.
  • Otimizar transferências de memória de host para dispositivo e de dispositivo para host.
Intervalo (60 minutos)
Kernels CUDA Personalizados em Python com Numba
(120 minutos)
  • Conhecer a hierarquia de threads paralelos da CUDA e aprender a ampliar as possibilidades de programas paralelos.
  • Iniciar kernels CUDA personalizados altamente paralelos na GPU.
  • Utilizar operações atômicas CUDA para evitar condições de corrida durante a execução paralela.
Intervalo (15 minutos)
Grades Multidimensionais e Memória Compartilhada para CUDA Python com Numba
(120 minutos)
  • Aprender a criar grades multidimensionais e a trabalhar em paralelo em matrizes 2D.
  • Aproveitar a memória compartilhada no dispositivo para promover memória coalescente e reformular matrizes 2D.
Revisão Final
(15 minutos)
  • Revisar os principais aprendizados e fazer perguntas.
  • Concluir a avaliação para ganhar o certificado.
  • Responder à pesquisa do workshop.
 

Detalhes do Workshop

Duração: 8 horas

Valor: US$500 para workshops públicos. Para workshops empresariais, fale conosco.

Pré-requisitos:

  • Competência básica em Python, incluindo familiaridade com tipos variáveis, loops, declarações condicionais, funções e manipulações de arrays
  • Competência em NumPy, incluindo o uso de ndarrays e ufuncs
  • Não é necessário ter conhecimento prévio de programação em CUDA

Tecnologias: Numba, NumPy

Certificado: após a conclusão bem-sucedida da avaliação, os participantes receberão um certificado do DLI da NVIDIA que reconhece a competência no assunto e contribui para o desenvolvimento da carreira e vida profissional.

Requisitos de Hardware: desktop ou notebook capaz de executar a versão mais atual do Chrome ou Firefox. Cada participante terá acesso exclusivo a um servidor totalmente configurado e acelerado por GPU no cloud.

Idiomas: inglês, chinês simplificado, chinês tradicional

PRÓXIMOS WORKSHOPS PÚBLICOS

Próximos Workshops Públicos

Europa/Oriente Médio/África

Quinta-feira, 26 de agosto de 2021
Das 9h às 17h (horário da Europa Central)

Se sua empresa tem interesse em aprimorar e desenvolver habilidades importantes de AI, ciência de dados acelerada ou computação acelerada, solicite um treinamento ministrado por instrutor do DLI da NVIDIA.

Perguntas?