SCIENCE DES DONNÉES ACCÉLÉRÉE PAR NVIDIA

La seule solution Hardware-to-Software du marché optimisée pour la science des données

Accélérez vos workflows de science des données grâce aux GPU NVIDIA

Les workflows traditionnels de science des données basés sur CPU s’avèrent le plus souvent aussi lents que fastidieux en matière de chargement, de filtrage, de manipulation des données, d’entraînement et de déploiement. Les GPU peuvent réduire les coûts d’infrastructure de manière significative et fournir des performances de pointe pour les workflows de science des données de bout en bout grâce aux capacités des bibliothèques logicielles NVIDIA RAPIDS™. La science des données accélérée par GPU est disponible partout : sur les PC de bureau, sur Data Center, à la périphérie des réseaux et dans le Cloud.

CARACTÉRISTIQUES ET AVANTAGES

Simplicité d’utilisation

Simplicité d’utilisation

Accélérez l’intégralité de votre chaîne de compilation 
Python grâce à une intégration logicielle optimisée sans modifications de code significatives. 

Hausse de la productivité

Hausse de la productivité

Accélérez jusqu’à 100 fois les procédures d’entraînement des workflows d’apprentissage automatique, avec des itérations plus fréquentes et une précision accrue.

Réduction des coûts

Réduction des coûts

Réduisez les coûts d'infrastructure de calcul de la science des données et augmentez l'efficacité du centre de données.

Apache Spark 3.0 bénéficie de l’accélération GPU avec NVIDIA RAPIDS

Apache Spark 3.0 est la toute première version de Spark à proposer une accélération GPU entièrement intégrée et transparente pour les workflows d’analyse de données et d’intelligence artificielle. Exploitez le plein potentiel de Spark 3.0 grâce à la puissance incomparable des GPU NVIDIA, que ce soit sur site ou dans le Cloud, sans même modifier votre code. Les performances révolutionnaires des GPU NVIDIA permettent aux entreprises et aux chercheurs d’entraîner plus rapidement des modèles complexes, tout en bénéficiant d’une importante valeur ajoutée grâce aux capacités phénoménales de l’IA.

Formation à XGBoost sur des GPU NVIDIA

L’accélération de XGBoost par les GPU NVIDIA offre des gains de performance décisif et optimise l’algorithme d’apprentissage automatique le plus important de l’industrie. Grâce à des performances d’entraînement bien plus rapides qu’avec les CPU, les équipes de science des données peuvent prendre en charge des jeux de données plus complexes, apporter un plus grand nombre de modifications et optimiser leurs modèles pour bénéficier d’une meilleure précision et d’une valeur ajoutée plus importante.

Data Prep

XGBoost

End-to-end

Accédez à nos guides dédiés à l’accélération GPU de XGBoost.

SOLUTIONS POUR LA SCIENCE DES DONNÉES

PC

Démarrez avec l’apprentissage automatique.

En savoir plus >

QUADRO

Stations de travail professionnelles pour l’apprentissage automatique.

En savoir plus >

Data Center

Systèmes à hautes performances spécifiquement conçus pour l’IA.

En savoir plus >

Cloud

Apprentissage automatique accéléré par GPU, n’importe où.

En savoir plus >

SCIENCE DES DONNÉES SUR GPU DANS LE CLOUD

La plateforme de science des données RAPIDS, entièrement accélérée par GPU, est un écosystème de calcul de nouvelle génération basé sur Apache Arrow. La collaboration de NVIDIA avec Ursa Labs va nous permettre d’accélérer l’innovation avec les bibliothèques Arrow les plus importantes tout en nous offrant des gains de performance significatifs pour les workflows d’analyse et d’ingénierie.

- Wes McKinney, Directeur d’Ursa Labs et créateur d’Apache Arrow et Pandas

L’utilisation combinée de RAPIDS et de XGBoost m’a permis de bénéficier de performances 24 fois plus rapides. Je peux désormais remplacer des centaines de nœuds GPU pour exécuter mes charges de travail ML les plus lourdes sur un nœud unique équipé de 8 GPU. NVIDIA a accéléré XGBoost d’une manière stupéfiante !

-Société de diffusion multimédia

Le traitement des données E/S représentait auparavant le principal frein à notre productivité. Il nous fallait jusqu’à 10 minutes pour traiter les données de 10 magasins réparties dans environ 1 million de colonnes. Grâce à RAPIDS, nous pouvons désormais traiter les données de 6 000 magasins et plusieurs millions de colonnes en moins de 3 minutes. Sur une infrastructure héritée, cela aurait nécessité près de 4 jours de traitement. Les gains de productivité sont exceptionnels.

-Détaillant spécialisé de marché intermédiaire avec 6 000 magasins

La plateforme de science des données RAPIDS, entièrement accélérée par GPU, est un écosystème de calcul de nouvelle génération basé sur Apache Arrow. La collaboration de NVIDIA avec Ursa Labs va nous permettre d’accélérer l’innovation avec les bibliothèques Arrow les plus importantes tout en nous offrant des gains de performance significatifs pour les workflows d’analyse et d’ingénierie.

- Wes McKinney, Directeur d’Ursa Labs et créateur d’Apache Arrow et Pandas

L’utilisation combinée de RAPIDS et de XGBoost m’a permis de bénéficier de performances 24 fois plus rapides. Je peux désormais remplacer des centaines de nœuds GPU pour exécuter mes charges de travail ML les plus lourdes sur un nœud unique équipé de 8 GPU. NVIDIA a accéléré XGBoost d’une manière stupéfiante !

-Société de diffusion multimédia

Le traitement des données E/S représentait auparavant le principal frein à notre productivité. Il nous fallait jusqu’à 10 minutes pour traiter les données de 10 magasins réparties dans environ 1 million de colonnes. Grâce à RAPIDS, nous pouvons désormais traiter les données de 6 000 magasins et plusieurs millions de colonnes en moins de 3 minutes. Sur une infrastructure héritée, cela aurait nécessité près de 4 jours de traitement. Les gains de productivité sont exceptionnels.

-Détaillant spécialisé de marché intermédiaire avec 6 000 magasins

La plateforme de science des données RAPIDS, entièrement accélérée par GPU, est un écosystème de calcul de nouvelle génération basé sur Apache Arrow. La collaboration de NVIDIA avec Ursa Labs va nous permettre d’accélérer l’innovation avec les bibliothèques Arrow les plus importantes tout en nous offrant des gains de performance significatifs pour les workflows d’analyse et d’ingénierie.

- Wes McKinney, Directeur d’Ursa Labs et créateur d’Apache Arrow et Pandas

L’utilisation combinée de RAPIDS et de XGBoost m’a permis de bénéficier de performances 24 fois plus rapides. Je peux désormais remplacer des centaines de nœuds GPU pour exécuter mes charges de travail ML les plus lourdes sur un nœud unique équipé de 8 GPU. NVIDIA a accéléré XGBoost d’une manière stupéfiante !

-Société de diffusion multimédia

Le traitement des données E/S représentait auparavant le principal frein à notre productivité. Il nous fallait jusqu’à 10 minutes pour traiter les données de 10 magasins réparties dans environ 1 million de colonnes. Grâce à RAPIDS, nous pouvons désormais traiter les données de 6 000 magasins et plusieurs millions de colonnes en moins de 3 minutes. Sur une infrastructure héritée, cela aurait nécessité près de 4 jours de traitement. Les gains de productivité sont exceptionnels.

-Détaillant spécialisé de marché intermédiaire avec 6 000 magasins

RAPIDS : NOUVELLES BIBLIOTHÈQUES LOGICIELLES POUR LA SCIENCE DES DONNÉES

RAPIDS repose sur plus de 15 années d’expertise dans l’apprentissage automatique et le développement avec  NVIDIA® CUDA® Cette puissante solution logicielle pour la science des données permet d’exécuter des procédures d’entraînement sur GPU de bout en bout - ce qui réduit la durée de l’entraînement de plusieurs jours à quelques minutes.

NVIDIA RAPIDS Flow
End-to-End Faster Speeds on RAPIDS

DÉMARREZ AVEC RAPIDS DÈS AUJOURD’HUI

Programmées avec Python et assemblées avec Apache Arrow, les bibliothèques RAPIDS respectent la norme open-source. Cette solution logicielle est développée en partenariat avec la communauté internationale du développement open-source.  Téléchargez RAPIDS pour accélérer vos workflows d’apprentissage automatique et de science des données.

ÉCOSYSTÈME DE PARTENAIRES

La plateforme RAPIDS, ouverte à tous, est en cours d’adoption par les principaux leaders de la science des données et de l’analyse numérique.

BIG DATA, ANALYSE, VISUALISATION

Anaconda
BlazingDB
DataBricks
Datalogue
FastData
Graphistry
H20.ai
Kinetica
MAPR
Omni Sci
Sqream
Uber

PLATEFORME D’ENTREPRISE POUR LA SCIENCE DES DONNÉES

IBM
Oracle
SAP
Sas

STOCKAGE

DellEMC
DDN STORAGE
HPE
IBM
NetApp
Pure Storage

Deep Learning

Chainer
PyTorch

Découvrez les solutions matérielles accélérées par RAPIDS