Este workshop aborda as ferramentas e técnicas fundamentais para executar aplicações em Python aceleradas por GPU usando GPUs CUDA® e o compilador Numba.
Objetivos de Aprendizagem
- Acelerar NumPy ufuncs com GPU e algumas linhas de código.
- Configurar a paralelização do código usando a hierarquia de threads da CUDA.
- Escrever kernels de dispositivos CUDA personalizados para o máximo desempenho e flexibilidade.
- Usar memória coalescente e memória compartilhada no dispositivo para aumentar a largura de banda de kernel da CUDA.
Faça download do datasheet do workshop (PDF de 67KB)