LA SCIENCE DES DONNÉES ACCÉLÉRÉE PAR NVIDIA

ACCÉLÉREZ L’ANALYSE DE DONNÉES GRÂCE AUX GPU NVIDIA

Les workflows de science des données ont longtemps été à la fois lents et fastidieux en matière de chargement, de filtrage, de manipulation des données et d’entraînement pour l’apprentissage automatique. Découvrez les nouvelles bibliothèques logicielles accélérées par GPU pour l'apprentissage automatique et l'analyse de données, que vous pouvez déployer sur les GPU de NVIDIA afin de maximiser la productivité, la performance et le retour sur investissement.

SOLUTIONS POUR LA SCIENCE DES DONNÉES

PC

Démarrez avec l’apprentissage automatique.

En savoir plus >

QUADRO

Stations de travail professionnelles pour l’apprentissage automatique.

En savoir plus >

Data Center

Systèmes à hautes performances spécifiquement conçus pour l’IA.

En savoir plus >

Cloud

Apprentissage automatique accéléré par GPU, n’importe où.

En savoir plus >

SCIENCE DES DONNÉES SUR GPU DANS LE CLOUD

La plateforme de science des données RAPIDS, entièrement accélérée par GPU, est un écosystème de calcul de nouvelle génération basé sur Apache Arrow. La collaboration de NVIDIA avec Ursa Labs va nous permettre d’accélérer l’innovation avec les bibliothèques Arrow les plus importantes tout en nous offrant des gains de performance significatifs pour les workflows d’analyse et d’ingénierie.

- Wes McKinney, Directeur d’Ursa Labs et créateur d’Apache Arrow et Pandas

Chez Databricks, nous nous réjouissons du potentiel de RAPIDS à accélérer les workflows basés sur Apache Spark. Plusieurs de nos projets au long cours vont pouvoir bénéficier d’une meilleure intégration de Spark avec des accélérateurs natifs, notamment via la plateforme de développement Apache Arrow et la planification GPU avec Project Hydrogen. Nous sommes convaincus que RAPIDS constitue une excellente opportunité de faire évoluer encore plus efficacement les workflows de nos clients reposant sur la science des données et l’IA.

- Matei Zaharia, Cofondateur et Directeur technique de Databricks, Fondateur d’Apache Spark

L’utilisation combinée de RAPIDS et de XGBoost m’a permis de bénéficier de performances 24 fois plus rapides. Je peux désormais remplacer des centaines de nœuds GPU pour exécuter mes charges de travail ML les plus lourdes sur un nœud unique équipé de 8 GPU. NVIDIA a accéléré XGBoost d’une manière stupéfiante !

-Société de diffusion multimédia

Le traitement des données E/S représentait auparavant le principal frein à notre productivité. Il nous fallait jusqu’à 10 minutes pour traiter les données de 10 magasins réparties dans environ 1 million de colonnes. Grâce à RAPIDS, nous pouvons désormais traiter les données de 6 000 magasins et plusieurs millions de colonnes en moins de 3 minutes. Sur une infrastructure héritée, cela aurait nécessité près de 4 jours de traitement. Les gains de productivité sont exceptionnels.

-Détaillant spécialisé de marché intermédiaire avec 6 000 magasins

La plateforme de science des données RAPIDS, entièrement accélérée par GPU, est un écosystème de calcul de nouvelle génération basé sur Apache Arrow. La collaboration de NVIDIA avec Ursa Labs va nous permettre d’accélérer l’innovation avec les bibliothèques Arrow les plus importantes tout en nous offrant des gains de performance significatifs pour les workflows d’analyse et d’ingénierie.

- Wes McKinney, Directeur d’Ursa Labs et créateur d’Apache Arrow et Pandas

Chez Databricks, nous nous réjouissons du potentiel de RAPIDS à accélérer les workflows basés sur Apache Spark. Plusieurs de nos projets au long cours vont pouvoir bénéficier d’une meilleure intégration de Spark avec des accélérateurs natifs, notamment via la plateforme de développement Apache Arrow et la planification GPU avec Project Hydrogen. Nous sommes convaincus que RAPIDS constitue une excellente opportunité de faire évoluer encore plus efficacement les workflows de nos clients reposant sur la science des données et l’IA.

- Matei Zaharia, Cofondateur et Directeur technique de Databricks, Fondateur d’Apache Spark

L’utilisation combinée de RAPIDS et de XGBoost m’a permis de bénéficier de performances 24 fois plus rapides. Je peux désormais remplacer des centaines de nœuds GPU pour exécuter mes charges de travail ML les plus lourdes sur un nœud unique équipé de 8 GPU. NVIDIA a accéléré XGBoost d’une manière stupéfiante !

-Société de diffusion multimédia

Le traitement des données E/S représentait auparavant le principal frein à notre productivité. Il nous fallait jusqu’à 10 minutes pour traiter les données de 10 magasins réparties dans environ 1 million de colonnes. Grâce à RAPIDS, nous pouvons désormais traiter les données de 6 000 magasins et plusieurs millions de colonnes en moins de 3 minutes. Sur une infrastructure héritée, cela aurait nécessité près de 4 jours de traitement. Les gains de productivité sont exceptionnels.

-Détaillant spécialisé de marché intermédiaire avec 6 000 magasins

La plateforme de science des données RAPIDS, entièrement accélérée par GPU, est un écosystème de calcul de nouvelle génération basé sur Apache Arrow. La collaboration de NVIDIA avec Ursa Labs va nous permettre d’accélérer l’innovation avec les bibliothèques Arrow les plus importantes tout en nous offrant des gains de performance significatifs pour les workflows d’analyse et d’ingénierie.

- Wes McKinney, Directeur d’Ursa Labs et créateur d’Apache Arrow et Pandas

Chez Databricks, nous nous réjouissons du potentiel de RAPIDS à accélérer les workflows basés sur Apache Spark. Plusieurs de nos projets au long cours vont pouvoir bénéficier d’une meilleure intégration de Spark avec des accélérateurs natifs, notamment via la plateforme de développement Apache Arrow et la planification GPU avec Project Hydrogen. Nous sommes convaincus que RAPIDS constitue une excellente opportunité de faire évoluer encore plus efficacement les workflows de nos clients reposant sur la science des données et l’IA.

- Matei Zaharia, Cofondateur et Directeur technique de Databricks, Fondateur d’Apache Spark

L’utilisation combinée de RAPIDS et de XGBoost m’a permis de bénéficier de performances 24 fois plus rapides. Je peux désormais remplacer des centaines de nœuds GPU pour exécuter mes charges de travail ML les plus lourdes sur un nœud unique équipé de 8 GPU. NVIDIA a accéléré XGBoost d’une manière stupéfiante !

-Société de diffusion multimédia

Le traitement des données E/S représentait auparavant le principal frein à notre productivité. Il nous fallait jusqu’à 10 minutes pour traiter les données de 10 magasins réparties dans environ 1 million de colonnes. Grâce à RAPIDS, nous pouvons désormais traiter les données de 6 000 magasins et plusieurs millions de colonnes en moins de 3 minutes. Sur une infrastructure héritée, cela aurait nécessité près de 4 jours de traitement. Les gains de productivité sont exceptionnels.

-Détaillant spécialisé de marché intermédiaire avec 6 000 magasins

CARACTÉRISTIQUES ET AVANTAGES

Simplicité d’utilisation

Simplicité d’utilisation

Accélérez l’intégralité de votre chaîne de compilation 
Python grâce à une intégration logicielle optimisée sans modifications de code significatives. 

Hausse de la productivité

Hausse de la productivité

Accélérez jusqu’à 100 fois les procédures d’entraînement des workflows d’apprentissage automatique, avec des itérations plus fréquentes et une précision accrue.

Réduction des coûts

Réduction des coûts

Réduisez les coûts d'infrastructure de calcul de la science des données et augmentez l'efficacité du centre de données.

RAPIDS : NOUVELLES BIBLIOTHÈQUES LOGICIELLES POUR LA SCIENCE DES DONNÉES

RAPIDS repose sur plus de 15 années d’expertise dans l’apprentissage automatique et le développement avec  NVIDIA® CUDA® Cette puissante solution logicielle pour la science des données permet d’exécuter des procédures d’entraînement sur GPU de bout en bout - ce qui réduit la durée de l’entraînement de plusieurs jours à quelques minutes.

NVIDIA RAPIDS Flow
End-to-End Faster Speeds on RAPIDS

Get started with Rapids today

RAPIDS libraries are open-source, written in Python, and built on Apache Arrow. The software is being developed in partnership with open-source communities globally. Download RAPIDS to experience acceleration of your machine learning and data science workflows.

Partner Ecosystem

RAPIDS is open to all and being adopted by the top enterprise leaders in data science and analytics.

BIG DATA, ANALYSE, VISUALISATION

Anaconda
BlazingDB
DataBricks
Datalogue
FastData
Graphistry
H20.ai
Kinetica
MAPR
Omni Sci
Sqream
Uber

PLATEFORME D’ENTREPRISE POUR LA SCIENCE DES DONNÉES

IBM
Oracle
SAP
Sas

STOCKAGE

DellEMC
DDN STORAGE
HPE
IBM
NetApp
Pure Storage

Deep Learning

Chainer
PyTorch

Découvrez les solutions matérielles accélérées par RAPIDS