Ciencia de datos acelerada por NVIDIA

Acelera mediante la GPU los flujos de trabajo del análisis de datos

Tradicionalmente, los flujos de trabajo de ciencia de datos han sido lentos y difíciles de manejar a la hora de cargar, filtrar y manipular los datos, al igual que el propio entrenamiento del aprendizaje automático. Explora el aprendizaje automático acelerado por GPU y las bibliotecas de análisis de datos, implementados en con GPU de NVIDIA, con el fin de maximizar la productividad, el rendimiento y el retorno de la inversión.

SOLUCIONES DE CIENCIA DE LOS DATOS

PC

Da tus primeros pasos en el aprendizaje automático.

Más info >

QUADRO

Estaciones de trabajo de aprendizaje automático de categoría profesional.

Más info >

CENTRO DE DATOS

Sistemas de IA diseñados expresamente para lograr el máximo rendimiento.

Más info >

NUBE

Aprendizaje automático acelerado en cualquier lugar.

Más info >

RAPIDS, una plataforma de ciencia de datos acelerada por GPU, es un ecosistema computacional de nueva generación potenciado por Apache Arrow. La colaboración de NVIDIA con Ursa Labs acelerará el ritmo de la innovación en las bibliotecas básicas de Arrow y contribuirá a conseguir importantes mejoras de rendimiento en las cargas de trabajo de los análisis y de la ingeniería de características.

- Wes McKinney, jefe de Ursa Labs y creador de Apache Arrow y pandas

En Databricks, nos entusiasma el potencial de RAPIDS para acelerar las cargas de trabajo de Apache Spark. Tenemos varios proyectos activos para integrar mejor Spark con aceleradores nativos, incluida la compatibilidad con Apache Arrow y la planificación de GPU con Project Hydrogen. Creemos que RAPIDS supone una oportunidad nueva y emocionante para escalar la ciencia de datos y las cargas de trabajo de IA de nuestros clientes.

- Matei Zaharia, cofundador y director de tecnología de Databricks, y creador original de Apache Spark

Logré una aceleración 24 veces mayor con RAPIDS XGBOOST y ahora puedo sustituir cientos de nodos de CPU, con lo que consigo ejecutar mi mayor carga de ML en un único nodo con 8 GPU. ¿Tal vez habéis acelerado XGBOOST demasiado?

- Empresa de streaming de contenido multimedia

Mi anterior cuello de botella era la E/S. …10 minutos para incorporar datos procedentes de 10 tiendas (aproximadamente 1 millón de filas). Con RAPIDS, podemos incorporar datos de unas 6000 tiendas (millones de filas) en menos de 3 minutos. Esa escala podría habernos llevado fácilmente cuatro días en una infraestructura de antigua generación… es simplemente impresionante.

- Un establecimiento especializado de gama media con 6000 tiendas

RAPIDS, una plataforma de ciencia de datos acelerada por GPU, es un ecosistema computacional de nueva generación potenciado por Apache Arrow. La colaboración de NVIDIA con Ursa Labs acelerará el ritmo de la innovación en las bibliotecas básicas de Arrow y contribuirá a conseguir importantes mejoras de rendimiento en las cargas de trabajo de los análisis y de la ingeniería de características.

- Wes McKinney, jefe de Ursa Labs y creador de Apache Arrow y pandas

En Databricks, nos entusiasma el potencial de RAPIDS para acelerar las cargas de trabajo de Apache Spark. Tenemos varios proyectos activos para integrar mejor Spark con aceleradores nativos, incluida la compatibilidad con Apache Arrow y la planificación de GPU con Project Hydrogen. Creemos que RAPIDS supone una oportunidad nueva y emocionante para escalar la ciencia de datos y las cargas de trabajo de IA de nuestros clientes.

- Matei Zaharia, cofundador y director de tecnología de Databricks, y creador original de Apache Spark

Logré una aceleración 24 veces mayor con RAPIDS XGBOOST y ahora puedo sustituir cientos de nodos de CPU, con lo que consigo ejecutar mi mayor carga de ML en un único nodo con 8 GPU. ¿Tal vez habéis acelerado XGBOOST demasiado?

- Empresa de streaming de contenido multimedia

Mi anterior cuello de botella era la E/S. …10 minutos para incorporar datos procedentes de 10 tiendas (aproximadamente 1 millón de filas). Con RAPIDS, podemos incorporar datos de unas 6000 tiendas (millones de filas) en menos de 3 minutos. Esa escala podría habernos llevado fácilmente cuatro días en una infraestructura de antigua generación… es simplemente impresionante.

- Un establecimiento especializado de gama media con 6000 tiendas

RAPIDS, una plataforma de ciencia de datos acelerada por GPU, es un ecosistema computacional de nueva generación potenciado por Apache Arrow. La colaboración de NVIDIA con Ursa Labs acelerará el ritmo de la innovación en las bibliotecas básicas de Arrow y contribuirá a conseguir importantes mejoras de rendimiento en las cargas de trabajo de los análisis y de la ingeniería de características.

- Wes McKinney, jefe de Ursa Labs y creador de Apache Arrow y pandas

En Databricks, nos entusiasma el potencial de RAPIDS para acelerar las cargas de trabajo de Apache Spark. Tenemos varios proyectos activos para integrar mejor Spark con aceleradores nativos, incluida la compatibilidad con Apache Arrow y la planificación de GPU con Project Hydrogen. Creemos que RAPIDS supone una oportunidad nueva y emocionante para escalar la ciencia de datos y las cargas de trabajo de IA de nuestros clientes.

- Matei Zaharia, cofundador y director de tecnología de Databricks, y fundador de Apache Spark

Logré una aceleración 24 veces mayor con RAPIDS XGBOOST y ahora puedo sustituir cientos de nodos de CPU, con lo que consigo ejecutar mi mayor carga de ML en un único nodo con 8 GPU. ¿Tal vez habéis acelerado XGBOOST demasiado?

- Empresa de streaming de contenido multimedia

Mi anterior cuello de botella era la E/S. …10 minutos para incorporar datos procedentes de 10 tiendas (aproximadamente 1 millón de filas). Con RAPIDS, podemos incorporar datos de unas 6000 tiendas (millones de filas) en menos de 3 minutos. Esa escala podría habernos llevado fácilmente cuatro días en una infraestructura de antigua generación… es simplemente impresionante.

- Un establecimiento especializado de gama media con 6000 tiendas

Características y ventajas

Facilidad de uso

Facilidad de uso

Acelera todo el ecosistema de python con una integración de software sin complicaciones y de código abierto, y cambios de código mínimos.

Más resultados

Más resultados

Acelera el entrenamiento de aprendizaje automático hasta 50 veces con más iteraciones para obtener una mejor precisión del modelo.

Rentabilidad

Rentabilidad

Reduce los costes de la infraestructura de computación de ciencia de datos e incrementa la eficiencia del centro de datos.

RAPIDS: nuevas bibliotecas de software para ciencia de datos

RAPIDS está diseñado después de más de 15 años de experiencia en desarrollo y aprendizaje automático de NVIDIA® CUDA®. Se trata de un nuevo y potente software para ejecutar sistemas de entrenamiento de ciencia de datos completos enteramente en la GPU y reducir así el tiempo de entrenamiento de días a minutos.

Flujo de NVIDIA RAPIDS
Velocidades completas más rápidas en RAPIDS

Empieza a trabajar hoy mismo con RAPIDS

Las bibliotecas de RAPIDS son de código abierto, están escritas en python y compiladas en Apache Arrow. El software está en desarrollo mediante la colaboración mundial de las comunidades de código abierto. Descarga RAPIDS para experimentar la aceleración de los flujos de trabajo de aprendizaje automático y ciencia de datos.

Ecosistema de colaboración

RAPIDS está disponible para todos y lo están adquiriendo las empresas líderes en ciencia y análisis de datos.

Big data, análisis, visualización

Anaconda
BlazingDB
DataBricks
Datalogue
FastData
Graphistry
H20.ai
Kinetica
MAPR
Omni Sci
Sqream
Uber

Plataforma de ciencia de datos empresarial

IBM
Oracle
SAP
Sas

Almacenamiento

Dell EMC
DDN STORAGE
HPE
IBM
NetApp
Pure Storage

Deep learning

Chainer
PyTorch

Explora soluciones de hardware acelerado por RAPIDS