딥 러닝 전문가 주도 워크숍
Fundamentals of Accelerated Computing with CUDA Python

이 워크숍은 CUDA® 및 Numba 컴파일러 GPU를 사용하여 GPU 가속 Python 애플리케이션을 실행하는 기본 도구 및 기법을 설명합니다. 수십 개의 실습 코딩을 수행하는 교육을 마치면 원래 CPU용으로 설계된 완전하게 기능하는 선형 대수 프로그램을 가속화하는 새로운 워크플로우를 구현함으로써 우수한 성능 향상을 확인할 수 있게 됩니다. 워크숍을 마치면 새로운 GPU 가속 애플리케이션을 구축하는 데 도움이 되는 추가 리소스에 액세스할 수 있게 됩니다.

 

학습 목표


이 워크숍에 참여함으로써 다음을 수행할 수 있게 됩니다.
  • 단 몇 줄의 코드로 GPU 가속 NumPy ufuncs 만들기
  • CUDA 스레드 계층을 사용하여 코드 병렬 처리 구성
  • 최대 성능과 유연성을 위한 맞춤형 CUDA 디바이스 커널 작성
  • 메모리 병합 및 디바이스의 공유 메모리를 사용하여 CUDA 커널 대역폭 증가
  • GPU에서 난수 생성
  • 중급 GPU 메모리 관리 기술 학습

워크숍 데이터시트 다운로드 (PDF 298 KB)

워크숍 개요

인트로
(15 분)
  • 전문가 강사와 만나기
  • courses.nvidia.com/join에서 계정 생성하기
Numba를 사용하는 CUDA Python 개론
(120 분)
  • Python에서 Numba 컴파일러 및 CUDA 프로그래밍 작업 시작하기
  • Numba 데코레이터를 사용하여 숫자 Python 함수의 GPU 가속화하기
  • 호스트-디바이스 및 디바이스-호스트로의 메모리 전송 최적화하기
휴식 (60 분)
Custom CUDA Kernels in Python with Numba
(120 분)
  • CUDA의 병렬 스레드 계층과 병렬 프로그램 가능성을 확장하는 방법 알아보기
  • GPU에서 대규모 병렬 맞춤형 CUDA 커널 실행하기
  • CUDA 원자적 연산을 활용하여 병렬 처리 실행 시 경쟁 상태 해결하기
휴식 (15 분)
RNG, 다차원 그리드 및 Numba 포함 CUDA Python용 공유 메모리
(120 분)
  • xoroshiro128+ RNG(난수 생성)을 사용하여 GPU 가속 Monte Carlo 방법 적용하기
  • 다차원 그리드 생성 및 2D 행렬에서 병렬로 작업하는 방법 알아보기
  • 디바이스의 공유 메모리를 활용하여 메모리 병합을 촉진하면서 2D 행렬 재구축하기
최종 복습
(15 분)
  • 핵심 내용을 복습하고 질문에 답하기
  • 평가를 완료하고 인증서 취득하기
  • 워크숍 설문지 작성하기
 

워크숍 정보

소요 시간: 8시간

가격: 엔터프라이즈 워크숍을 위한 $500 의 퍼블릭 워크숍 문의는 여기로 문의하여 주세요

전제 조건:

  • 변수 유형, 루프, 조건문, 함수, 어레이 처리 등의 기본 Python 역량
  • ndarrays 및 ufuncs의 사용을 포함하는 NumPy 역량
  • CUDA 프로그래밍 사전 지식 필요 없음

기술: Numba, NumPy

인증: 평가를 성공적으로 완료한 참가자는 관련 분야에 대한 역량을 인정받고 전문적 커리어 성장을 지원하는 NVIDIA DLI 인증서를 받게 됩니다.

하드웨어 요구 사항: 최신 버전의 Chrome 또는 Firefox를 실행할 수 있는 데스크톱 또는 노트북 각 참가자에게는 클라우드상에서 완전하게 구성된 GPU 가속 서버에 접근할 수 있는 전용 권한이 주어집니다.

언어: 영어, 중국어 간체, 중국어 번체

Upcoming Workshops

AI, 데이터 사이언스 또는 가속 컴퓨팅 분야의 핵심 기술을 향상하고 개발하는 데 관심이 있는 기업의 경우, NVIDIA DLI에 딥 러닝 전문가 주도 교육을 요청할 수 있습니다.

질문이 있으신가요?