이 워크숍에서는 CUDA® 기반의 초병렬 GPU에서 실행되도록 C/C++ 애플리케이션을 가속화하는 기본 도구와 기법을 설명합니다. 코드를 작성하고, CUDA를 사용하여 코드 병렬화를 구성하고, CPU와 GPU 가속기 간의 메모리 마이그레이션을 최적화하고, 새로운 작업에서 학습한 워크플로우를 구현함으로써 입자 시뮬레이터(완전하게 기능하지만 오직 CPU 전용)를 가속화하고 확연히 보이는 막대한 성능 향상을 달성하는 방법을 설명합니다. 워크숍을 마치면 새로운 GPU 가속 애플리케이션을 개발할 수 있도록 추가 리소스에 액세스할 수 있습니다.

 

학습 목표


이 워크숍에 참여함으로써 다음을 수행할 수 있게 됩니다.
  • GPU 가속기로 실행할 코드 작성
  • CUDA를 사용하여 C/C++ 애플리케이션에서 데이터 및 명령어 수준 병렬 처리 제공 및 표현
  • CUDA 관리 메모리를 활용하고 비동기 프리패치를 사용하여 메모리 마이그레이션 최적화
  • 명령 줄과 시각적 프로파일러를 활용해 작업 안내
  • 명령어 수준 병렬 처리에 동시 스트림 활용
  • GPU 가속 CUDA C/C++ 애플리케이션을 작성하거나 프로필 중심 접근 방법을 사용하여 기존의 CPU 전용 애플리케이션 리팩토링

워크숍 데이터시트 다운로드 (PDF 294 KB)

워크숍 개요

인트로
(15 mins)
  • 전문가 강사와 만나기
  • courses.nvidia.com/join에서 계정 생성하기
CUDA C/C++를 사용한 애플리케이션 가속화
(120 mins)

    CUDA를 사용하여 GPU 지원 C/C++ 애플리케이션을 작성할 수 있는 필수 구문 및 개념 알아보기

  • GPU 코드 작성, 컴파일 및 실행하기
  • 병렬 스레드 계층 제어하기
  • GPU용 메모리 할당 및 해제하기
휴식 (60 mins)
CUDA C/C++를 사용하여 가속화 애플리케이션 메모리 관리
(120 mins)

    명령줄 프로파일러 및 CUDA 관리 메모리에 대해 알아봅니다. 관찰에 기반한 애플리케이션 개선 및 관리되는 메모리 동작의 깊이 있는 이해에 초점을 맞춥니다.

  • 명령 줄 프로파일러를 사용하여 CUDA 코드 프로파일링하기
  • 통합 메모리를 심층적으로 이해하기
  • 통합 메모리 관리를 최적화하기
휴식 (15 mins)
CUDA C/C++를 통한 가속화 애플리케이션의 비동기 스트리밍 및 시각적 프로파일링
(120 mins)

    개선된 메모리 관리 및 명령어 수준의 병렬 처리 기회를 포착합니다:

  • NVIDIA Visual Profiler를 사용하여 CUDA 코드 프로파일링하기
  • 동시 CUDA 스트림 사용하기
최종 복습
(15 분)
  • 핵심 내용을 복습하고 질문에 답하기
  • 평가를 완료하고 인증서 취득하기
  • 워크숍 설문지 작성하기
 

워크숍 정보

소요 시간: 8시간

가격: NVIDIA에 문의하세요  

전제 조건:

  • 변수 유형, 루프, 조건문, 함수, 어레이 처리 등 기본 C++ 역량
  • CUDA 프로그래밍 사전 지식 필요 없음

기술: nvprof, nvpp

인증: 평가를 성공적으로 완료한 참가자는 관련 분야에 대한 역량을 인정받고 전문적 커리어 성장을 지원하는 NVIDIA DLI 인증서를 받게 됩니다.

하드웨어 요구 사항: 최신 버전의 Chrome 또는 Firefox를 실행할 수 있는 데스크톱 또는 노트북 각 참가자에게는 클라우드상에서 완전하게 구성된 GPU 가속 서버에 접근할 수 있는 전용 권한이 주어집니다.

언어: 영어, 일본어, 한국어, 중국어 간체, 중국어 번체

Upcoming Workshops

AI, 데이터 사이언스 또는 가속 컴퓨팅 분야의 핵심 기술을 향상하고 개발하는 데 관심이 있는 기업의 경우, NVIDIA DLI에 딥 러닝 전문가 주도 교육을 요청할 수 있습니다.

질문이 있으신가요?