A CPU é composta por apenas alguns núcleos com muita memória de cache que podem lidar com alguns threads de software por vez. Por outro lado, uma GPU é composta por centenas de núcleos que podem lidar com milhares de threads simultaneamente.
As GPUs oferecem a tecnologia da computação paralela, antes tão pouco conhecida.
Dask + NVIDIA: Impulsionando Análises Aceleradas Acessíveis
A NVIDIA entende o poder que as GPUs oferecem para a análise de dados. É por isso que a NVIDIA tem se esforçado para capacitar profissionais de ciência de dados, machine learning e inteligência artificial para aproveitar ao máximo seus dados. Vendo a potência e a acessibilidade do Dask, a NVIDIA começou a usá-lo no projeto RAPIDS com o objetivo de dimensionar horizontalmente cargas de trabalho de análise de dados aceleradas para várias GPUs e sistemas baseados em GPU.

Devido à interface Python acessível e à versatilidade além da ciência de dados, o Dask cresceu em outros projetos em toda a NVIDIA, tornando-se uma escolha natural em novas aplicações que vão desde a análise do JSON até o gerenciamento de workflows de deep learning de ponta a ponta. Veja alguns dos muitos projetos e colaborações em andamento da NVIDIA usando o Dask:
RAPIDS
O RAPIDS é um conjunto de APIs e bibliotecas de software de código aberto para executar pipelines de ciência de dados inteiramente em GPUs, geralmente reduzindo o tempo de treinamento de dias para minutos. Desenvolvido com base no NVIDIA® CUDA-X AI™, o RAPIDS une anos de desenvolvimento em gráficos, machine learning, computação de alto desempenho (HPC - High-Performance Computing) e muito mais.

Embora o CUDA-X seja incrivelmente poderoso, a maioria dos profissionais de análise de dados prefere experimentar, construir e treinar modelos com um conjunto de ferramentas Python, como NumPy, Pandas e Scikit-learn mencionados anteriormente. O Dask é um componente fundamental do ecossistema do RAPIDS, tornando ainda mais fácil para os profissionais de dados aproveitar a computação acelerada por uma experiência de usuário confortável baseada em Python.

NVTabular
O NVTabular é uma biblioteca de recursos e pré-processamento projetada para manipular de forma rápida e fácil terabytes de conjuntos de dados tabulares. Desenvolvido com base na biblioteca Dask-cuDF, ele fornece uma camada de abstração de alto nível, simplificando a criação de operações de ETL de alto desempenho em grande escala. O NVTabular é capaz de dimensionar para milhares de GPUs aproveitando o RAPIDS e o Dask, eliminando o gargalo de espera para que os processos de ETL sejam concluídos.
cuStreamz
Internamente na NVIDIA, estamos usando o Dask para alimentar partes de nossos produtos e operações de negócios. Usando o Streamz, o Dask e o RAPIDS, criamos o cuStreamz, uma plataforma acelerada de dados de transmissão usando Python 100% nativo. Com o cuStreamz, podemos conduzir análises em tempo real para algumas das nossas aplicações mais exigentes, como o GeForce NOW, o NVIDIA GPU Cloud e o NVIDIA Drive SIM. Embora seja um projeto novo, já vimos reduções impressionantes no custo total de propriedade em relação a outras plataformas de dados de streaming usando o cuStreamz habilitado para Dask.