Science des données accélérée par NVIDIA

La seule solution Hardware-to-Software du marché optimisée pour la science des données

Accélérez vos workflows de science des données grâce aux GPU de NVIDIA

Les workflows traditionnels de science des données basés sur CPU s’avèrent le plus souvent aussi lents que fastidieux en matière de chargement, de filtrage, de manipulation des données, d’entraînement et de déploiement. Les GPU peuvent réduire les coûts d’infrastructure de manière significative et fournir des performances de pointe pour les workflows de science des données de bout en bout grâce aux capacités des bibliothèques logicielles open-source RAPIDS. La science des données accélérée par GPU est disponible partout : sur les PC de bureau, sur Data Center, à la périphérie des réseaux et dans le Cloud.

 

Caractéristiques et avantages

Simplicité d’utilisation

Maximisez la productivité

Réduisez les délais d’attente pour obtenir des informations à haute valeur ajoutée et accélérer le retour sur investissement.

Simplicité d’utilisation

Simplicité d’utilisation

Accélérez l’intégralité de votre chaîne de compilation Python grâce à une intégration logicielle optimisée sans modifications de code significatives.

Hausse de la productivité

Hausse de la productivité

Accélérez jusqu’à 215 fois les procédures d’entraînement des workflows d’apprentissage automatique, avec des itérations plus fréquentes. Expérimentez davantage pour mener à bien vos projets d’exploration.

Hausse de la productivité

Renforcez la précision

Itération plus rapide des modèles pour de meilleurs résultats et des performances plus élevées

Réduction des coûts

Réduction des coûts

Réduisez le coût des infrastructures de science des données et améliorez le rendement énergétique de votre Data Center.

Réduction des coûts

Coût total de possession

Réduction significative des coûts d’infrastructure pour Data Center

 

Apache Spark 3.0 bénéficie de l’accélération GPU avec NVIDIA RAPIDS

Apache Spark 3.0 est la toute première version de Spark à proposer une accélération GPU entièrement intégrée et transparente pour les workflows d’analyse de données et d’intelligence artificielle. Exploitez le plein potentiel de Spark 3.0 grâce à la puissance incomparable des GPU NVIDIA, que ce soit sur site ou dans le Cloud, sans même modifier votre code. Les performances révolutionnaires des GPU NVIDIA permettent aux entreprises et aux chercheurs d’entraîner plus rapidement des modèles complexes, tout en bénéficiant d’une importante valeur ajoutée grâce aux capacités phénoménales de l’IA.

Formation à XGBoost sur des GPU NVIDIA

L’accélération de XGBoost par les GPU NVIDIA offre des gains de performance décisif et optimise l’algorithme d’apprentissage automatique le plus important de l’industrie. Grâce à des performances d’entraînement bien plus rapides qu’avec les CPU, les équipes de science des données peuvent prendre en charge des jeux de données plus complexes, apporter un plus grand nombre de modifications et optimiser leurs modèles pour bénéficier d’une meilleure précision et d’une valeur ajoutée plus importante.

Préparation des données

XGBoost

Bout en bout

Découvrez comment tirer parti de l’accélération GPU de XGBoost

Solutions pour la science des données

PC

Démarrez avec l’apprentissage automatique.

En savoir plus >

Stations de travail

Découvrez un nouveau type de stations de travail pour la science des données.

En savoir plus >

Data Center

Systèmes NVIDIA certifiés pour les entreprises qui exécutent des charges de travail d’IA modernes.

En savoir plus >

Cloud

Apprentissage automatique accéléré par GPU, n’importe où.

En savoir plus >

L’accélération GPU en action

Maximisez les performances, la productivité et le retour sur investissement de vos workflows d’apprentissage automatique.

RAPIDS : bibliothèques logicielles pour la science des données

RAPIDS, qui exploite NVIDIA CUDA-X AI, repose sur plus de 15 années d’expertise dans l’apprentissage automatique et le développement avec NVIDIA® CUDA®. Cette puissante solution logicielle pour la science des données permet d’exécuter des procédures d’entraînement sur GPU de bout en bout - ce qui réduit la durée de l’entraînement de plusieurs jours à quelques minutes.

Flux avec NVIDIA RAPIDS
Gains de vitesse de bout en bout avec RAPIDS

La plateforme de science des données RAPIDS, entièrement accélérée par GPU, est un écosystème de calcul de nouvelle génération basé sur Apache Arrow. La collaboration de NVIDIA avec Ursa Labs va nous permettre d’accélérer l’innovation avec les bibliothèques Arrow les plus importantes tout en nous offrant des gains de performance significatifs pour les workflows d’analyse et d’ingénierie.

- Wes McKinney, Directeur d’Ursa Labs et créateur d’Apache Arrow et Pandas

L’utilisation combinée de RAPIDS et de XGBoost m’a permis de bénéficier de performances 24 fois plus rapides. Je peux désormais remplacer des centaines de nœuds GPU pour exécuter mes charges de travail ML les plus lourdes sur un nœud unique équipé de 8 GPU. NVIDIA a accéléré XGBoost d’une manière stupéfiante !

- Société de diffusion multimédia

Le traitement des données E/S représentait auparavant le principal frein à notre productivité. Il nous fallait jusqu’à 10 minutes pour traiter les données de 10 magasins réparties dans environ 1 million de colonnes. Grâce à RAPIDS, nous pouvons désormais traiter les données de 6 000 magasins et plusieurs millions de colonnes en moins de 3 minutes. Sur une infrastructure héritée, cela aurait nécessité près de 4 jours de traitement. Les gains de productivité sont exceptionnels.

- Détaillant spécialisé de marché intermédiaire avec 6 000 magasins

La plateforme de science des données RAPIDS, entièrement accélérée par GPU, est un écosystème de calcul de nouvelle génération basé sur Apache Arrow. La collaboration de NVIDIA avec Ursa Labs va nous permettre d’accélérer l’innovation avec les bibliothèques Arrow les plus importantes tout en nous offrant des gains de performance significatifs pour les workflows d’analyse et d’ingénierie.

- Wes McKinney, Directeur d’Ursa Labs et créateur d’Apache Arrow et Pandas

L’utilisation combinée de RAPIDS et de XGBoost m’a permis de bénéficier de performances 24 fois plus rapides. Je peux désormais remplacer des centaines de nœuds GPU pour exécuter mes charges de travail ML les plus lourdes sur un nœud unique équipé de 8 GPU. NVIDIA a accéléré XGBoost d’une manière stupéfiante !

- Société de diffusion multimédia

Le traitement des données E/S représentait auparavant le principal frein à notre productivité. Il nous fallait jusqu’à 10 minutes pour traiter les données de 10 magasins réparties dans environ 1 million de colonnes. Grâce à RAPIDS, nous pouvons désormais traiter les données de 6 000 magasins et plusieurs millions de colonnes en moins de 3 minutes. Sur une infrastructure héritée, cela aurait nécessité près de 4 jours de traitement. Les gains de productivité sont exceptionnels.

- Détaillant spécialisé de marché intermédiaire avec 6 000 magasins

La plateforme de science des données RAPIDS, entièrement accélérée par GPU, est un écosystème de calcul de nouvelle génération basé sur Apache Arrow. La collaboration de NVIDIA avec Ursa Labs va nous permettre d’accélérer l’innovation avec les bibliothèques Arrow les plus importantes tout en nous offrant des gains de performance significatifs pour les workflows d’analyse et d’ingénierie.

- Wes McKinney, Directeur d’Ursa Labs et créateur d’Apache Arrow et Pandas

L’utilisation combinée de RAPIDS et de XGBoost m’a permis de bénéficier de performances 24 fois plus rapides. Je peux désormais remplacer des centaines de nœuds GPU pour exécuter mes charges de travail ML les plus lourdes sur un nœud unique équipé de 8 GPU. NVIDIA a accéléré XGBoost d’une manière stupéfiante !

- Société de diffusion multimédia

Le traitement des données E/S représentait auparavant le principal frein à notre productivité. Il nous fallait jusqu’à 10 minutes pour traiter les données de 10 magasins réparties dans environ 1 million de colonnes. Grâce à RAPIDS, nous pouvons désormais traiter les données de 6 000 magasins et plusieurs millions de colonnes en moins de 3 minutes. Sur une infrastructure héritée, cela aurait nécessité près de 4 jours de traitement. Les gains de productivité sont exceptionnels.

- Détaillant spécialisé de marché intermédiaire avec 6 000 magasins

Écosystème de partenaires

La plateforme RAPIDS, ouverte à tous, est en cours d’adoption par les principaux leaders de la science des données et de l’analyse numérique.

Big Data, Analyse, Visualisation

Anaconda
BlazingDB
DataBricks
Datalogue
FastData
Graphistry
H20.ai
Kinetica
MAPR
Omni Sci
Sqream
Uber

Plateforme d’entreprise pour la science des données

IBM
Oracle
SAP
Sas

Stockage

DellEMC
DDN STORAGE
HPE
IBM
NetApp
Pure Storage

Deep Learning

Chainer
PyTorch

Webinaires

Transformation du développement de l’IA sur les stations de travail de NVIDIA pour la science des données

Optimisation des performances et de la productivité pour l’apprentissage automatique avec XGBoost

RAPIDS pour la science des données accélérée par GPU pour la Santé

Accélération intégrale de la science des données avec RAPIDS et DGX-2

Découvrez les solutions matérielles accélérées par RAPIDS