NVIDIA
Deep Learning Institute

세계에서 가장 어려운 문제를 해결하도록 교육을 제공합니다.

이제 DLI가 AI 및 가속 컴퓨팅 분야를 위한 개발자 인증 프로그램을 제공합니다.

NVIDIA DLI(Deep Learning Institute)는 실제 문제를 해결할 수 있도록 AI 및 가속 컴퓨팅 분야의 핸즈온 세션을 제공합니다. 개발자, 데이터 과학자, 연구자를 위해 고안된 DLI 콘텐츠는 다음 세 가지 형식으로 제공됩니다.

온라인 과정

DLI 온라인 과정은 엔드 투 엔드 프로젝트를 구현 및 배포하는 방법을 8시간 동안 교육합니다. 온라인 과정은 장소 및 시간에 구애받지 않고 수강할 수 있으며 클라우드 상에서 완전히 구성된 GPU 가속화 워크스테이션에 대한 액세스를 제공합니다.

온라인 선택 강좌

DLI 선택 강좌는 특정 기술이나 개발 기법을 적용하는 방법을 2시간 동안 교육합니다. 선택 강좌는 전체 길이 과정과 마찬가지로 장소와 시간에 구애받지 않고 들을 수 있으며 클라우드에서 GPU에 대한 액세스가 제공됩니다.

Instructor 주도 워크샵

오프라인 워크샵은 실습 교육을 통해 엔드 투 엔드 프로젝트를 구현 및 배포하는 방법을 8시간 동안 교육합니다. 고객 현장, 컨퍼런스, 대학에서 제공되는 전일 워크숍에는 DLI 인증 강사가 제공하는 핸즈온 세션과 강의가 포함됩니다.

인증

인증

과정은 장소 및 시간에 구애받지 않고 시작할 수 있으며 클라우드 상에서 완전히 구성된 GPU 가속화 워크스테이션에 대한 액세스가 제공됩니다.

온라인 과정

클라우드 상에서 완전히 구성된 GPU 가속화 워크스테이션에 대한 액세스가 제공되므로 자가 주도 과정 및 선택 강좌는 장소 및 시간에 구애받지 않고 시작할 수 있습니다.

딥 러닝 소개

딥 러닝을 처음 접하신다면 그 첫 단계는 현실 세계의 문제를 해결하기 위해 신경망을 학습 및 배포하는 방법을 학습하는 것입니다.

과정
  • 컴퓨터 비전을 위한 딥 러닝의 기초  

    전제 조건: 없음

    프레임워크: Caffe

    언어: 영어

    비용: $90

    인증 가능

    성능 및 기능을 개선하기 위해 신경망을 학습하고 결과를 이용하면서 딥 러닝의 기초적인 내용을 살펴봅니다.

    이 과정에서는 신경망을 학습 및 배포하면서 딥 러닝의 기초를 배웁니다. 학습 내용

    • 이미지 분류 및 물체 감지 등의 일반적인 딥 러닝 워크플로우 구현
    • 성능 및 기능 향상을 위해 데이터, 학습 매개변수, 네트워크 구조 및 기타 전략을 이용해 실험
    • 실제 세상의 문제를 해결하기 시작하기 위해 신경망 배포

    이 과정을 완료하면 딥 러닝 관련 문제를 스스로 해결하기 시작할 수 있습니다.

선택 강좌
  • DIGITS를 통한 이미지 분류

    전제 조건: 없음

    프레임워크: Caffe(DIGITS 인터페이스 포함)

    언어: 영어, 중국어, 일본어

    비용: 무료

    딥 러닝은 일반 코딩 방법을 사례 기반의 학습으로 제작된 모델로 대체하여 전적으로 새로운 솔루션을 가능하게 합니다. 다음을 통해 심층 신경망을 교육하여 수기 문자를 인식합니다.

    • 교육 환경으로 이미지 데이터 로딩
    • 네트워크 선택 및 교육
    • 새 데이터로 테스트하고 성능을 개선하기 위해 반복

    이 과정을 완료하면 교육을 위해 사용해야 하는 데이터를 평가할 수 있습니다.

  • DIGITS를 통한 물체 감지

    전제 조건: 신경망에 대한 기본적인 경험

    프레임워크: Caffe(DIGITS 인터페이스 포함)

    언어: 영어, 중국어

    비용: 무료

    다음과 같이 항공 이미지에서 전체 얼굴을 감지하는 과제를 통해 물체 감지에 딥 러닝을 적용하는 방법을 배웁니다.

    • 기존 컴퓨터 비전과 딥 러닝 결합
    • 딥 러닝 프레임워크인 Caffe를 사용하여 기존 신경망에 부차적인 "뇌 수술" 수행
    • 용도에 맞게 제작된 네트워크와 라벨이 있는 엔드 투 엔드 데이터를 식별 및 이용함으로써 딥 러닝 커뮤니티의 지식 활용

    이 과정을 완료하면 딥 러닝으로 커스텀 문제를 해결할 수 있습니다.

  • DIGITS 및 TensorRT를 통한 신경망 배포

    전제 조건: 신경망에 대한 기본적인 경험

    프레임워크: DIGITS, TensorRT

    언어: 영어, 중국어

    비용: $30

    딥 러닝을 통해 입력을 전산적으로 가장 집약적인 출력으로 매핑할 수 있습니다. 다음을 통해 이미지를 식별하고 실시간으로 보행자를 감지하는 애플리케이션에 딥 러닝을 배포하는 방법을 배웁니다.

    • 트레이닝된 모델을 구성하는 파일 액세스 및 이해
    • 각 기능의 고유한 입력 및 출력에서 빌드
    • 처리량 및 대기 시간과 같은 다양한 성능 지표에 대해 애플리케이션의 전산적으로 가장 집약적인 부분 최적화

    이 과정을 완료하면 딥 러닝을 구현하여 실제 문제를 해결할 수 있습니다.

  • TensorFlow, MXNet, NVIDIA Docker를 통한 딥 러닝 워크플로우

    전제 조건: bash 터미널에 대한 기본적인 경험

    프레임워크: TensorFlow, MXNet

    언어: 영어, 중국어

    비용: $30

    NVIDIA Docker 플러그인을 통해 GPU를 사용하여 생산 등급 딥 러닝 워크플로우를 컨테이너화할 수 있습니다. 다음을 통해 호스트 구성 및 관리를 절감하는 방법을 배웁니다.

    • Docker 이미지로 작업하고 컨테이너 라이프스타일을 관리하는 방법 학습
    • 구성 가능한 경량 컨테이너를 생성하는 경우 재사용을 극대화하기 위해 공개 Docker 이미지 레지스트리인 DockerHub의 이미지에 액세스
    • TensorFlow 및 MXNet 프레임워크 모두를 사용하여 신경망 교육

    이 과정을 완료하면 딥 러닝용으로 사전 구성된 이미지를 컨테이너화 및 배포할 수 있습니다.

  • TensorFlow를 통한 이미지 분할

    전제 조건: 신경망에 대한 기본적인 경험

    프레임워크: TensorFlow

    언어: 영어

    비용: $30

    이미지(또는 의미론적) 세분화는 이미지의 각 픽셀을 특정 클래스로 배치하는 작업입니다. 다음을 통해 MRI 이미지를 세분화하여 심장의 각 부분을 측정하는 방법을 배웁니다.

    • 이미지 세분화를 다른 컴퓨터 비전 문제와 비교
    • TensorBoard 및 TensorFlow Python API와 같은 TensorFlow 도구로 실험
    • 모델 성능을 평가하기 위해 효과적인 지표를 구현하는 방법 학습

    이 과정을 완료하면 딥 러닝을 사용하여 대부분의 컴퓨터 비전 워크플로우를 설정할 수 있습니다.

  • Microsoft Cognitive Toolkit을 통한 이미지 분류

    전제 조건: 없음

    프레임워크: Microsoft Cognitive Toolkit

    언어: 영어

    비용: $30

    Microsoft Cognitive Toolkit 프레임워크를 이용해 신경망을 교육하는 방법을 배웁니다. 점점 더 복잡해지는 네트워크를 구축 및 교육하여 다음을 수행합니다.

    • BrainScript의 “Simple Network Builder”를 사용하는 신경망 표현식과 보다 일반화할 수 있는 “Network Builder”를 사용하는 신경망 표현식의 비교
    • 신경망 그래프 시각화
    • 신경망을 교육 및 테스트하여 수기 문자 분류

    이 과정을 완료하면 나선형 신경망(CNN)의 기본 지식을 습득하고 더욱 향상된 Microsoft Cognitive Toolkit 사용으로 이행할 수 있습니다.

  • TensorFlow를 통한 선형 분류

    전제 조건: 없음

    프레임워크: TensorFlow

    언어: 영어

    비용: $30

    TensorFlow의 TFLearn API를 이용해 구조화된 데이터로부터 예측을 도출하는 방법을 배웁니다. 인구 조사 데이터가 주어지면 개인 수입을 예측하는 과제를 통해 다음을 수행합니다.

    • 머신 러닝을 위해 CSV에서 데이터 로드, 보기 및 정리
    • 신경망의 기능 및 라벨(입력, 출력)로 기존 데이터 세트 분할
    • 선형에서 심층에 이르는 모델 구축 및 성능 차이 평가

    이 과정을 완료하면 자신의 구조화된 데이터에서 예측을 도출할 수 있습니다.

  • DIGITS를 통한 신호 처리

    전제 조건: 신경망 교육에 대한 기본적인 경험

    프레임워크: Caffe, DIGITS

    언어: 영어, 중국어

    비용: $30

    심층 신경망은 인간보다 이미지 분류 능력이 더 뛰어나며 이는 컴퓨터 비전에서 기대하는 바를 뛰어 넘습니다. 노이즈로 손상된 약한 신호를 감지하기 위해 무선 주파수(RF) 신호를 이미지로 변환하는 방법을 배웁니다. 학습 내용:

    • 비이미지 데이터를 이미지 데이터로 처리
    • DIGITS에서 딥 러닝 워크플로우(로드, 교육, 테스트, 조정) 구현
    • 프로그래밍 방식으로 성능을 테스트하고 성능 개선 사항 안내

    이 과정을 완료하면 딥 러닝을 사용하여 이미지 및 유사 이미지 데이터 모두를 분류할 수 있습니다.

가속 컴퓨팅 소개

가속 컴퓨팅을 처음 접하신다면 CUDA 및 OpenACC를 통해 애플리케이션을 가속화하는 방법을 학습해 시작하십시오.

과정
  • CUDA C/C++를 사용한 가속 컴퓨팅의 기초 

    전제 조건: C/C++에 대한 기본적인 경험

    언어: 영어

    비용: $90

    인증 가능

    CUDA 컴퓨팅 플랫폼을 이용하면 세계에서 가장 빠른 초병렬 GPU에서 실행할 수 있도록 CPU 전용 애플리케이션을 가속화할 수 있습니다. 다음에 의한 C/C++ 애플리케이션 가속화를 경험합니다.

    • GPU에서 잠재 병렬 처리를 실행하기 위해 CPU 전용 애플리케이션 가속화
    • 가속화된 애플리케이션을 최적화하기 위해 필수적인 CUDA 메모리 관리 기법 활용
    • 가속화된 애플리케이션의 동시 실행에 대한 잠재성을 노출하고 CUDA 스트림으로 이를 활용
    • 명령줄과 시각적 프로파일링을 활용해 작업을 안내 및 확인

    이 과정을 완료하면 가장 필수적인 CUDA 도구 및 기술을 이용해 기본 C/C++ CPU 전용 애플리케이션을 가속화 및 최적화할 수 있게 됩니다.

  • CUDA Python을 사용한 가속 컴퓨팅의 기초

    전제 조건: CPython 및 NumPy에 대한 기본적인 경험

    언어: 영어

    비용: $90

    이 과정에서는 적시 생산형의 유형 특화 Python 함수 컴파일러인 Numba를 사용하여 초병렬 NVIDIA GPU에서 Python 프로그램을 가속화하는 방법을 알아봅니다. 학습 내용

    • Numba를 사용해 NumPy 전역 함수(ufuncs)에서 CUDA 커널을 컴파일
    • Numba를 사용해 커스텀 CUDA 커널을 생성 및 시작
    • 핵심 GPU 메모리 관리 기법을 적용

    이 과정을 완료하면 Numba를 사용해 CUDA 커널을 컴파일 및 실행하여 NVIDIA GPU 상에서 Python 애플리케이션을 가속화할 수 있습니다.

  • OpenACC를 사용한 가속 컴퓨팅의 기초

    전제 조건: C/C++에 대한 기본적인 경험

    언어: 영어

    비용: $90

    GPU에서의 프로그래밍을 위해 높은 수준의 프로그래밍 언어인 OpenACC의 기초를 배웁니다. 이 과정은 C/C++에 대한 경험이 약간 있으며 CPU 전용 프로그래밍의 한계를 넘어선 애플리케이션 성능 가속화에 관심이 있는 모든 사람들 위한 것입니다. 과정 학습 내용

    • OpenACC로 기존 애플리케이션을 가속화하는 간단한 4단계 방법
    • OpenACC 코드베이스를 프로파일링하고 최적화하는 방법
    • OpenACC를 MPI(메시지 전달 인터페이스)와 결합하여 다중 GPU 시스템에서 프로그래밍하는 방법

    이 과정을 완료하면 OpenACC, CUDA 인식 MPI, NVIDIA 프로파일링 도구의 조합을 사용하여 복수의 GPU 클러스터에서 가속화된 이종 애플리케이션을 구축하고 최적화할 수 있습니다.

선택 강좌
  • CUDA C/C++를 통한 애플리케이션 가속화

    전제 조건: C/C++에 대한 기본적인 경험

    언어: 영어, Japanese

    비용: 무료

    CUDA를 이용해 C/C++ 애플리케이션을 가속화함으로써 초병렬 NVIDIA GPU의 성능을 활용하는 방법을 배웁니다. 다음을 위해 CUDA로 프로그래밍하는 방법을 학습합니다.

    • SAXPY 알고리즘 가속화
    • 행렬 곱셈 알고리즘 가속화
    • 열전도 알고리즘 가속화

    이 과정을 완료하면 CUDA 플랫폼을 사용하여 C/C++ 애플리케이션을 가속화할 수 있습니다.

  • OpenACC – 4단계로 2배 가속화

    전제 조건: C/C++에 대한 기본적인 경험

    언어: 영어

    비용: 무료

    OpenACC를 이용해 C/C++ 또는 Fortran 애플리케이션을 가속화함으로써 초병렬 NVIDIA GPU의 성능을 활용하는 방법을 배웁니다. OpenACC는 가속기 코드를 직접 작성하는 대신 코드를 가속화하기 위해 컴파일러 힌트를 제공하는 지침 기반 컴퓨팅 접근 방법입니다. OpenACC를 이용해 애플리케이션을 가속화하기 위한 4단계 프로세스를 지금 시작하십시오.

    • 애플리케이션 특성 분석 및 프로파일링
    • 컴퓨팅 지침 추가
    • 데이터 이동을 최적화하는 지침 추가
    • 커널 스케줄링을 사용하여 애플리케이션 최적화

    이 과정을 완료하면 OpenACC 지침을 사용하여 C/C++ 애플리케이션을 빠르게 가속화하는 프로필 중심 접근 방법을 사용할 수 있습니다.

  • 가속 컴퓨팅 소개

    전제 조건: C/C++에 대한 기본적인 경험

    언어: 영어

    비용: $30

    GPU의 코드 가속화를 위한 3가지 기술 탐색:

    • GPU 가속화 라이브러리 사용
    • OpenACC와 같은 컴파일러 지침 사용
    • CUDA 지원 언어로 직접 코드 작성

    이 과정을 완료하면 GPU 이식의 잠재적인 속도 향상과 사용 편의성을 입증하는 방법을 이해할 수 있습니다.

  • CUDA C/C++를 통한 GPU 메모리 최적화

    전제 조건: C/C++에 대한 기본적인 경험

    언어: 영어

    비용: $30

    NVIDIA GPU 상에서 CUDA C/C++로 프로그래밍하기 위한 메모리 최적화 기법과 이러한 최적화를 뒷받침하기 위해 NVVP(NVIDIA Visual Profiler)를 사용하는 방법을 탐색합니다. 학습 내용:

    • 기본 행렬 전치 알고리즘 구현
    • NVVP로 알고리즘을 프로파일링하는 여러 주기를 수행하고 성능을 최적화

    이 과정을 완료하면 글로벌 및 공유 메모리 액세스 패턴을 분석 및 개선하는 방법, 가속화 C/C++ 애플리케이션을 최적화하는 방법을 알 수 있습니다.

  • C/C++의 GPU 가속화 라이브러리를 통한 애플리케이션 가속화

    전제 조건: “CUDA C/C++를 통한 애플리케이션 가속화” 또는 이와 유사한 경험을 보유

    언어: 영어

    비용: $30

    드롭인 라이브러리를 사용해 C/C++ 애플리케이션을 가속화함으로써 초병렬 NVIDIA GPU의 성능을 활용하는 방법을 배웁니다. 다음 방법을 포함하여 3가지 연습을 수행합니다.

    • cuBLAS를 사용해 기본 행렬 곱셈 가속화
    • 일부 cuRAND API 호출을 이전 cuBLAS 호출에 추가하여 라이브러리 결합
    • nvprof를 사용하여 코드를 프로파일링하고 일부 CUDA 런타임 API 호출로 최적화

    이 과정을 완료하면 기존 CPU 전용 C/C++ 프로그램에서 신속한 애플리케이션 가속화를 위해 여러 CUDA 지원 라이브러리를 활용할 수 있습니다.

  • Python의 GPU 가속화 라이브러리를 통한 애플리케이션 가속화

    전제 조건: Python에 대한 기본적인 경험

    언어: 영어

    비용: $30

    다음을 통해 GPU 라이브러리를 이용하여 NVIDIA GPU에서 Python 코드를 가속화하는 방법을 배웁니다.

    • cuRAND 라이브러리를 이용해 Monte Carlo 프라이서 가속화
    • CPU와 GPU 간 데이터 이동 최적화

    이 과정을 완료하면 GPU 가속화 Python 라이브러리를 이용해 CPU 전용 Python 코드 가속화를 시작할 수 있습니다.

  • Thrust를 이용한 C++를 가속화

    전제 조건: “CUDA C/C++를 통한 애플리케이션 가속화” 또는 이와 유사한 경험을 보유

    언어: 영어

    비용: $30

    Thrust는 대략적으로 C++ 표준 템플릿 라이브러리를 기반으로 하는 병렬 알고리즘 라이브러리입니다. 개발자가 병렬 컴퓨팅의 성능을 빠르게 수용하도록 하고 OpenMP 및 Intel의 스레딩 빌딩 블록과 같은 여러 시스템 백엔드를 지원합니다. Thrust를 사용하여 다음을 다루는 연습을 통해 C++을 가속화합니다.

    • 기본 반복자, 컨테이너 및 기능
    • 내장 및 커스텀 기능
    • CPU 처리의 이식성

    이 과정을 완료하면 Thrust 라이브러리의 성능을 활용하여 C/C++ 애플리케이션을 가속화할 수 있습니다.

  • OpenACC를 통한 프로파일링 및 병렬화

    전제 조건: “OpenACC - 4단계로 2배 가속화” 또는 이와 유사한 경험을 보유

    언어: 영어

    비용: $30

    OpenACC 프로그래밍 주기, 즉 병렬 처리 식별 및 병렬 처리 표현의 첫 2단계를 지금 시작하십시오. 학습 내용:

    • NVIDIA NVPROF를 사용하여 제공된 C 또는 Fortran 애플리케이션 프로파일링
    • PGI OpenACC 컴파일러를 사용하여 코드 가속화

    이 과정을 완료하면 애플리케이션 가속화를 위해 OpenACC 지침을 적용하는 위치를 파악하기 위해 CPU 전용 C 또는 Fortran 애플리케이션을 프로파일링할 수 있습니다.

  • OpenACC를 통한 데이터 이동 표현 및 루프 최적화

    전제 조건: “OpenACC를 통한 프로파일링 및 병렬화” 또는 이와 유사한 경험을 보유

    언어: 영어

    비용: $30

    다음을 통해 중간 OpenACC 프로그래밍 기술을 배웁니다.

    • OpenACC 데이터 관리 지침 추가
    • OpenACC 루프 지침을 사용하여 애플리케이션 최적화

    이 과정을 완료하면 OpenACC를 이용해 데이터 전송을 최적화하고 애플리케이션 병렬 처리를 미세 조정할 수 있습니다.

  • MPI 및 OpenACC를 통한 다중 GPU 프로그래밍 소개

    전제 조건: “OpenACC - 4단계로 2배 가속화” 또는 이와 유사한 경험을 보유

    언어: 영어

    비용: $30

    MPI(Message Passing Interface) 및 OpenACC를 이용해 여러 GPU 시스템 또는 GPU 클러스터를 프로그래밍하는 방법을 배웁니다. 학습 내용:

    • CUDA 인식 MPI 및 OpenACC를 이용해 다른 GPU 간 데이터 교환
    • 여러 GPU 시스템에서 GPU 선호도 처리
    • 연산을 통해 통신을 중복하여 통신 시간 숨기기

    이 과정을 완료하면 여러 GPU 환경에서 OpenACC 및 MPI의 결합을 통해 애플리케이션을 가속화할 수 있습니다.

  • MPI 및 OpenACC를 통한 고급 다중 GPU 프로그래밍

    전제 조건: “MPI 및 OpenACC를 통한 다중 GPU 프로그래밍 소개” 또는 이와 유사한 경험을 보유

    언어: 영어

    비용: $30

    다음을 통해 여러 GPU MPI + OpenACC 가속화 애플리케이션을 개선하는 방법을 배웁니다.

    • 연산을 통해 통신을 중복하여 통신 시간 숨기기
    • 2D 타일 도메인 분해를 통해 유리된 halo 업데이트 처리

    이 과정을 완료하면 OpenACC 및 MPI로 가속화된 애플리케이션에서 중간 기술을 활용할 수 있습니다.

  • OpenACC를 이용한 GPU에서의 파이프라이닝 작업

    전제 조건: “OpenACC를 통한 데이터 이동 표현 및 루프 최적화” 또는 이와 유사한 경험 보유

    언어: 영어

    비용: $30

    파이프라이닝이라고 알려진 단순한 기술을 이용해 GPU 연산과 중복되도록 데이터 사본을 최적화하여 OpenACC 기술을 다음 수준으로 끌어 올립니다. 학습 내용:

    • OpenACC 루틴 지침을 이용해 장치의 기능 호출 허용
    • 대규모 작업을 바이트 크기 단위로 분해/li>
    • CPU에서 비동기적으로 이러한 단위 작업

    이 과정을 완료하면 OpenACC에서 파이프라이닝을 사용하여 거의 무료로 데이터 사본을 효과적으로 만들 수 있습니다.

  • OpenACC로 지진 애플리케이션을 가속화하기 위한 프로필 중심 접근 방식

    전제 조건: 없음

    언어: 영어

    비용: $30

    다음을 통해 프로파일러를 사용하여 GPU의 코드를 가속화 및 최적화하는 경험을 개선하는 방법을 배웁니다.

    • PGI 프로파일러 사용
    • NVIDIA 프로파일러 사용
    • OpenACC를 이용해 Seismic Unix와 함께 포함된 Kirchhoff 2D 뎁스 마이그레이션 가속화

    이 과정을 완료하면 OpenACC로 프로필 중심 접근 방법을 사용하여 여러 아키텍처에 대해 가속화 및 데이터 최적화를 수행할 수 있습니다.

  • CUDA Fortran을 통한 애플리케이션 가속화

    전제 조건: Fortran에 대한 기본적인 경험

    언어: 영어

    비용: $30

    CUDA를 사용해 Fortran 애플리케이션을 가속화함으로써 초병렬 NVIDIA GPU의 성능을 활용하는 방법을 배웁니다. CUDA로 프로그래밍하여 다음을 수행합니다.

    • SAXPY 알고리즘 가속화
    • 행렬 곱셈 알고리즘 가속화
    • 열전도 알고리즘 가속화

    이 과정을 완료하면 CUDA 플랫폼을 사용하여 Fortran 애플리케이션을 가속화할 수 있습니다.

  • CUDA Fortran을 통한 GPU 메모리 최적화

    전제 조건: : “CUDA Fortran을 통한 애플리케이션 가속화” 또는 이와 유사한 경험 보유

    언어: 영어

    비용: $30

    NVIDIA GPU 상에서 CUDA Fortran으로 프로그래밍하기 위한 유용한 메모리 최적화 기법과 이러한 최적화를 뒷받침하기 위해 NVVP(NVIDIA Visual Profiler)를 사용하는 방법을 배웁니다. 다음을 수행합니다.

    • 기본 행렬 전치 알고리즘 구현
    • NVVP로 알고리즘을 프로파일링하는 여러 주기를 수행하고 성능을 최적화

    이 과정을 완료하면 글로벌 및 공유 메모리 액세스 패턴을 분석 및 개선하는 방법, 가속화 Fortran 애플리케이션을 최적화하는 방법을 알 수 있습니다.

  • Fortran의 GPU 가속화 라이브러리를 통한 애플리케이션 가속화

    전제 조건: : Fortran에 대한 기본적인 경험

    언어: 영어

    비용: $30

    다음을 통해 GPU 라이브러리를 이용하여 NVIDIA GPU에서 Fortran 코드를 가속화하는 방법을 배웁니다.

    • cuRAND 라이브러리를 이용해 Monte Carlo 프라이서 가속화
    • CPU와 GPU 간 데이터 이동 최적화

    이 과정을 완료하면 GPU 가속화 Fortran 라이브러리를 이용해 CPU 전용 Fortran 코드를 가속화할 수 있습니다.

산업별 딥 러닝 과정

딥 러닝에 대한 기초 지식을 습득하였으면 이제 고급 과정인 산업별 DLI 교육에 지식을 적용해 실제 문제를 해결할 수 있습니다.

게임 개발 및 디지털 콘텐츠
 

선택 강좌
  • GAN(General Adversarial Network)을 TensorFlow 및 DIGITS와 함께 사용해 이미지 생성

    전제 조건: CNN에 대한 경험

    프레임워크: TensorFlow

    언어: 영어

    비용: $30

    DIGITS에서 이미지 콘텐츠를 생성하기 위해 GAN(Generative Adversarial Network)을 교육하는 방법을 배웁니다. 학습 내용:

    • GAN을 사용하여 수기 숫자 생성
    • 기능 공간을 시각화하고 속성 벡터를 사용하여 이미지 아날로지 생성
    • GAN을 교육하여 설정된 속성으로 이미지 생성

    이 과정을 완료하면 GAN을 사용하여 기능 공간을 조작함으로써 이미지를 생성할 수 있습니다.

  • Torch를 통한 이미지 스타일 전송

    전제 조건: CNN에 대한 경험

    프레임워크: TensorFlow

    언어: 영어

    비용: $30

    특이한 시각적 특징을 추출함으로써 한 이미지의 외관과 느낌을 다른 이미지로 전달하는 방법을 탐색합니다. 기능 추출을 위해 나선형 신경망(CNN)이 사용되는 방법과 이러한 기능이 새 이미지를 생성하는 생성자에 제공되는 방법을 확인하십시오. 학습 내용:

    • 특이한 시각적 특징을 추출함으로써 한 이미지의 외관과 느낌을 다른 이미지로 전달
    • 다양한 기술을 사용하여 스타일이 올바르게 전송되는지 여부를 정성적으로 확인
    • 임의의 스타일 전송을 위해 아키텍처 혁신 및 교육 기술 사용

    이 과정을 완료하면 신경망을 사용하여 비디오에 효과적인 속도로 임의의 스타일을 전송할 수 있습니다.

  • 오토인코더를 이용해 렌더링된 이미지의 노이즈 제거

    전제 조건: CNN에 대한 경험

    프레임워크: TensorFlow

    언어: 영어

    비용: $30

    광선 추적된 이미지의 노이즈 제거 속도를 대폭 높이는 데 오토인코더가 포함된 신경망이 어떻게 사용될 수 있는지 배웁니다. 학습 내용:

    • 렌더링된 이미지에 노이즈가 있는지 파악
    • 사전 트레이닝된 네트워크를 사용하여 일부 샘플 이미지 또는 자체 이미지에서 노이즈 제거
    • 제공된 데이터 세트를 사용하여 자체 노이즈 제거기 교육

    이 과정을 완료하면 신경망 내부에서 오토인코더를 사용하여 자체 렌더링된 이미지 노이즈 제거기를 교육할 수 있습니다.

  • 오토인코더를 사용한 이미지 초고해상도

    전제 조건: CNN에 대한 경험

    프레임워크: Keras

    언어: 영어

    비용: $30

    오토인코더를 통해 신경망의 힘을 활용하여 저품질 원본 이미지로 고품질 이미지를 만드십시오. 단축 과정 학습 내용:

    • 오토인코더를 이해하고 디자인합니다
    • 이미지 품질을 엄밀히 측정하는 다양한 방법을 배웁니다

    이 과정을 완료하면 신경망 내부에서 오토인코더를 사용하여 품질을 상당히 개선할 수 있습니다.

의료
 

선택 강좌
  • Keras에서 회귀 신경망을 사용하여 시계열 데이터 모델링

    전제 조건: 딥 러닝에 대한 기본적인 경험

    프레임워크: Keras

    언어: 영어

    비용: 무료

    회귀 신경망(RNN)을 이용하여 모델을 통해 자연 언어, 시장, 시간 경과에 따른 환자의 건강과 같은 시계열 데이터를 분류 또는 예측할 수 있습니다. 학습 내용:

    • HDF5(계층적 데이터 형식 버전 5)에서 전자 건강 기록을 사용하여 교육 및 테스트 데이터 세트 생성
    • 회귀 신경망과 함께 사용하기 위해 데이터 세트를 준비하여 매우 복잡한 데이터 시퀀스의 모델링 허용
    • Theano 위에서 실행하는 Keras 라이브러리를 사용해 LSTM(Long-Short Term Memory) 모델, 특정 RNN 아키텍처를 구성하여 기준 데이터에 대해 모델 성능 평가

    이 과정을 완료하면 RNN을 사용하여 시계열 데이터를 모델링할 수 있습니다.

  • MedNIST 데이터 세트를 사용하여 의료 영상 분류

    전제 조건: 없음

    프레임워크: DIGITS

    언어: 영어

    방사선학 및 의료 영상 딥 러닝에 대한 실용적인 핸즈온 입문 과정을 확인하십시오. 학습 내용:

    • 의료 영상 데이터 수집, 형식 지정 및 표준화
    • 데이터 세트에서 나선형 신경망(CNN) 설계 및 교육
    • 트레이닝된 모델을 사용하여 새로운 의료 영상 분류

    이 과정을 완료하면 의료 영상 데이터 세트에서 영상을 분류하기 위해 CNN을 적용할 수 있습니다.

  • DIGITS를 사용한 의료 이미지 세분화

    전제 조건: CNN 및 Python에 대한 기본적인 경험

    프레임워크: DIGITS, Caffe

    언어: 영어

    비용: $30

    이미지(또는 의미론적) 세분화는 이미지의 각 픽셀을 특정 클래스로 배치하는 작업입니다. 다음을 통해 MRI 이미지를 세분화하여 심장의 각 부분을 측정하게 됩니다.

    • 맞춤형 Python 레이어를 통해 Caffe 확장
    • Transfer 러닝 프로세스 구현
    • 널리 사용되는 이미지 분류 네트워크를 통해 완전한 나선형 신경망(CNN) 구축

    이 과정을 완료하면 딥 러닝을 사용하여 대부분의 컴퓨터 비전 워크플로우를 설정할 수 있습니다.

  • TensorFlow를 통한 이미지 분류: 레디오믹—1p19q 염색체 상태 분류

    전제 조건: CNN 및 Python에 대한 기본적인 경험

    프레임워크: TensorFlow

    언어: 영어

    비용: $30

    Mayo Clinic에서 실시 중인 연구 덕분에 딥 러닝 기술을 사용하여 MRI 이미지에서 레디오믹을 감지함으로써 뇌종양 환자를 더 효과적으로 치료하고 더 좋은 결과를 제공할 수 있게 되었습니다. 다음을 통해 1p19q 공동 삭제 바이오마커를 감지하는 방법을 배웁니다.

    • 나선형 신경망(CNN)을 디자인하고 교육합니다
    • 이미징 유전체학(레디오믹)을 사용하여 외과적 생체 조직 검사 없이 병의 유전체학을 식별하는 바이오마커를 생성합니다
    • Mayo Clinic에서 진행되는 방사선 유전체학 연구를 살펴봅니다

    이 과정을 완료하면 딥 러닝을 사용한 레디오믹 예측의 참신함과 유망한 결과에 대한 자신만의 통찰력을 갖게 됩니다.

  • R 및 MXNet을 통한 의료 이미지 분석

    전제 조건: CNN 및 Python에 대한 기본적인 경험

    프레임워크: MXNet

    언어: 영어

    비용: $30

    나선형 신경망(CNNs)을 의료 이미지 분석에 적용하여 비가시적 이미지로 환자 상태를 추론할 수 있습니다. CNN을 교육하여 시계열 MRI 데이터를 통해 인간 심장의 좌심실 용적을 추론하는 방법을 알아보십시오. 학습 내용:

    • 기존의 2D CNN을 더 복잡한 데이터로 확장합니다
    • 표준 Python API 및 R을 통해 MXNet을 사용합니다
    • 용적 측정의 성격을 가지며 일시적 구성 요소를 가질 수 있는 고차원 이미지를 처리합니다

    이 과정을 완료하면 비가시적 이미지를 위해 CNN을 사용할 수 있습니다.

  • 의료 영상을 위한 Generative Networks를 통한 데이터 증강 및 세분화

    전제 조건: CNN에 대한 경험

    프레임워크: TensorFlow

    언어: 영어

    비용: $30

    GAN(Generative Adversarial Network)은 제공된 트레이닝 데이터에 기반하여 새로운 예제를 생성하는 생성자와, 원본 데이터와 시뮬레이션된 데이터를 구분하려 시도하는 판별자로 이루어진 한 쌍의 심층 신경망입니다. 두 네트워크가 함께 성장함에 따라 생성되는 예시는 점점 더 현실적으로 변할 것입니다. 이 기술은 기존 네트워크의 트레이닝을 위한 규모가 작은 데이터 세트를 증강할 수 있으므로 의료 분야에서 전도유망합니다. 학습 내용:

    • 뇌의 합성 MRI 생성
    • 세분화를 위해 GAN 적용
    • 정확도를 높이기 위한 데이터 증강에 GAN 활용

    이 과정을 완료하면 의료 영상 사용 사례에 GAN을 적용할 수 있게 됩니다.

  • 의료 영상을 위한 CFCM(Coarse-to-Fine Contextual Memory)

    전제 조건: CNN에 대한 경험

    프레임워크: TensorFlow

    언어: 영어

    비용: $30

    CFCM은 매우 심층적인 아키텍처를 사용하고 서로 다른 많은 스케일의 기능을 나선형의 LSTM(Long short-term memory)과 통합하는 이미지 세분화를 위해 개발된 기술입니다. 학습 내용:

    • 의료 이미지 세분화를 위한 인코더-디코더 아키텍처에 대한 심도 있는 검토
    • 일반적인 빌딩 블록(나선형, 풀링 레이어, 잔존 넷 등)에 대해 이해
    • Skip Connection을 위한 다양한 전략 조사

    이 과정을 완료하면 의료 영상 세분화 및 유사한 이미징 작업에 CFCM 기술을 적용할 수 있게 됩니다.

  • Keras, Theano와 DragoNN을 사용한 유전체학용 딥 러닝

    전제 조건: 나선형 신경망(CNN) 및 Python에 대한 기본적인 경험

    프레임워크: Keras, Theano

    언어: 영어

    비용: $30

    딥 러닝 모델을 해석하여 예측 가능한 유전체 서열 패턴을 찾는 방법을 알아보십시오. 다음의 목적으로 딥 유전체 조절 유전체학 신경망(DragoNN) 툴킷을 시뮬레이션된 조절 유전체학 데이터와 실제 조절 유전체학 데이터에 대해 사용합니다.

    • 널리 사용되는 DragoNN 아키텍처를 쉽게 이해합니다
    • DragoNN 모델을 사용하여 조절 서열을 모델링하고 해석하기 위한 가이드라인을 살펴봅니다
    • 유전체학 및 고성능 모델의 문제 식별에 있어 언제 DragoNN이 탁월한 선택인지 파악합니다

    이 과정을 완료하면 예측 가능한 유전체 서열 패턴 발견을 사용해 새로운 생물학적 통찰력을 얻을 수 있습니다.

지능적 비디오 분석
 

선택 강좌
  • TensorRT를 사용한 지능적 비디오 분석을 위한 배포

    전제 조건: CNN 및 C++에 대한 기본적인 경험

    프레임워크: TensorRT

    언어: 영어

    비용: $30

    교육된 신경망에 새로 입력된 데이터에 대한 답을 찾도록 임무를 부여하는 것을 배포라고 부릅니다. TensorRT는 신경망의 추론 성능을 개선하는 다양한 옵션을 갖춘 기본적인 배포 도구입니다. 단축 과정 학습 내용

    • giexec를 사용해 추론을 실행하는 방법을 배웁니다.
    • 혼합된 정밀 INT8을 사용해 추론을 최적화합니다.
    • 플러그인을 위해 맞춤형 레이어 API를 활용합니다.

    이 과정을 완료하면 TensorRT를 사용해 신경망을 위한 추론 성능을 가속화할 수 있습니다.

의료
 

선택 강좌

Instructor 주도 워크샵

해당 지역에서 예정되어 있는 워크샵을 찾아보거나 워크샵을 주최하도록 요청하십시오.

예정된 워크샵에 참석하십시오.

당신의 조직을 위한 DLI를 개최해보십시오.

관리자는 기업 또는 조직 내에서 DLI 워크숍을 진행하도록 요청할 수 있습니다. 아래에 열거된 기초 또는 산업별 주제 중에서 선택하십시오.

엔터프라이즈를 위한 더 포괄적인 교육을 찾고 계시는 경우에도 DLI가 도움을 드릴 수 있습니다. 당사는 고객사와 협력해 조직의 고유한 요구 사항을 만족시키는 과정 및 워크숍 패키지를 구성합니다. 온라인 및 현장 핸즈온 세션부터 임원 보고 및 엔터프라이즈 수준의 보고까지, DLI는 고객사가 AI 조직으로 전환하는 과정을 도와드릴 수 있습니다. 자세히 알아보시려면 문의해주십시오.

딥 러닝 소개

  • 컴퓨터 비전을 위한 딥 러닝의 기초

    전제 조건: 없음

    프레임워크: Caffe

    언어: 영어

    인증 가능

    성능 및 기능을 개선하기 위해 신경망을 학습하고 결과를 이용하면서 딥 러닝의 기초적인 내용을 살펴봅니다.

    이 과정에서는 신경망을 학습 및 배포하면서 딥 러닝의 기초를 배웁니다. 학습 내용

    • 이미지 분류 및 물체 감지 등의 일반적인 딥 러닝 워크플로우 구현
    • 성능 및 기능 향상을 위해 데이터, 학습 매개변수, 네트워크 구조 및 기타 전략을 이용해 실험
    • 실제 세상의 문제를 해결하기 시작하기 위해 신경망 배포

    이 과정을 완료하면 딥 러닝 관련 문제를 스스로 해결하기 시작할 수 있습니다.

  • 여러 데이터 유형에 대한 딥 러닝의 기초

    전제 조건: “컴퓨터 비전을 위한 딥 러닝의 기초” 또는 이와 유사한 경험을 보유

    프레임워크: TensorFlow

    언어: 영어

    이 과정에서는 이미지 및 비디오 클립 내의 콘텐츠에 대한 효과적인 설명을 생성하기 위해 나선형 및 회귀 신경망을 결합하는 방법을 살펴봅니다.

    다음을 통해 이미지 및 비디오에서 캡션을 생성하기 위해 TensorFlow 및 MSCOCO(Microsoft Common Objects in Context) 데이터 세트를 이용하여 네트워크를 교육하는 방법을 배웁니다.

    • 이미지 세분화 및 텍스트 생성 등의 딥 러닝 워크플로우 구현
    • 데이터 유형, 워크플로우 및 프레임워크 비교 및 대조
    • 컴퓨터 비전 및 자연어 처리 결합

    이 과정을 완료하면 여러 유형의 데이터 입력이 필요한 딥 러닝 문제를 해결할 수 있게 됩니다.

가속 컴퓨팅 소개

  • CUDA C/C++를 사용한 가속 컴퓨팅의 기초

    전제 조건: C/C++에 대한 기본적인 경험

    언어: 영어

    인증 가능

    CUDA 컴퓨팅 플랫폼은 세계에서 가장 빠른 초병렬 GPU에서 실행할 수 있도록 CPU 전용 애플리케이션의 가속화를 지원합니다. 다음에 의한 C/C++ 애플리케이션 가속화를 경험

    • GPU에서 잠재 병렬 처리를 실행하기 위해 CPU 전용 애플리케이션 가속화
    • 가속화된 애플리케이션을 최적화하기 위해 필수적인 CUDA 메모리 관리 기법 활용
    • 가속화된 애플리케이션의 동시 실행에 대한 잠재성을 노출하고 CUDA 스트림으로 이를 활용
    • 명령줄과 시각적 프로파일링을 활용해 작업을 안내 및 확인

    이 과정을 완료하면 가장 필수적인 CUDA 도구 및 기술을 이용해 기본 C/C++ CPU 전용 애플리케이션을 가속화 및 최적화할 수 있게 됩니다. 가속화된 애플리케이션을 빠르게 출시할 수 있는 CUDA 개발의 반복적 스타일을 이해할 수 있으실 것입니다.

  • OpenACC를 사용한 가속 컴퓨팅의 기초

    전제 조건: C/C++에 대한 기본적인 경험

    언어: 영어

    GPU에서의 프로그래밍을 위해 높은 수준의 프로그래밍 언어인 OpenACC의 기초를 배웁니다. 이 과정은 C/C++에 대한 경험이 약간 있으며 CPU 전용 프로그래밍의 한계를 넘어선 애플리케이션 성능 가속화에 관심이 있는 모든 사람들 위한 것입니다. 과정 학습 내용

    • OpenACC로 기존 애플리케이션을 가속화하는 간단한 4단계 방법
    • OpenACC 코드베이스를 프로파일링하고 최적화하는 방법
    • OpenACC를 MPI(메시지 전달 인터페이스)와 결합하여 다중 GPU 시스템에서 프로그래밍하는 방법

    이 과정을 완료하면 OpenACC, CUDA 인식 MPI, NVIDIA 프로파일링 도구의 조합을 사용하여 복수의 GPU 클러스터에서 가속화된 이종 애플리케이션을 구축하고 최적화할 수 있습니다.

산업별 딥 러닝 워크샵

  • 자율 주행 자동차를 위한 딥 러닝 - 인지

    전제 조건: CNN에 대한 경험

    프레임워크: TensorFlow, DIGITS, TensorRT

    언어: 영어

    이 과정에서는 NVIDIA DRIVE PX 개발 플랫폼을 이용하는 자동 주행 차량을 위해 딥 신경망을 설계, 교육 및 배포하는 방법을 배웁니다.

    방법 알아보기

    • DriveWorks 소프트웨어 스택을 이용하여 센서 입력 통합
    • 의미론적 세분화 신경망 교육
    • TensorRT를 이용해 교육을 거친 신경망을 최적화, 검증 및 배포

    이 과정을 완료하면 학생들은 NVIDIA DRIVE PX를 사용하는 자동 주행 차량에 대한 인지 요소를 생성 및 최적화할 수 있습니다.

  • 금융 거래 전략을 위한 딥 러닝

    전제 조건: 신경망에 대한 경험과 금융 산업에 대한 지식

    프레임워크: TensorFlow

    언어: 영어

    주성분 분석(PCA)과 같은 선형 기술은 통계적 차익 거래 전략에 사용하기 위한 ‘고유의 포트폴리오’를 생성할 수단입니다. 시계열 금융 데이터를 이용하는 기타 기술도 널리 보급되어 있습니다. 하지만 이제 거래 전략은 심층신경망의 힘으로 더욱 발전할 수 있습니다.

    과정 학습 내용

    • 시계열 데이터를 준비하고 트레이닝과 테스트 데이터 세트로 네트워크 성능을 테스트
    • 벡터 입력을 읽고 예측하도록 LSTM(Long short-term memory) 네트워크를 구성하고 훈련
    • 오토인코더를 이상 탐지기로 사용하여 차익 거래 전략 수립

    이 과정을 완료하면 시계열 금융 데이터를 활용하여 예측하고 신경망을 이용한 차익 거래로 이익을 남길 수 있습니다.

  • 의료 이미지 분석을 위한 딥 러닝

    전제 조건: CNN 및 Python에 대한 기본적인 경험

    프레임워크: Caffe, DIGITS, MXNet, TensorFlow

    언어: 영어

    이 과정은 다양한 의료 작업 및 계산을 수행하기 위해 나선형 신경망(CNN)을 MRI 스캔에 적용하는 방법을 살펴봅니다. 학습 내용

    • 좌심실 위치 파악을 위해 MRI 이미지에서 이미지 세분화를 수행
    • 심장질환 감지를 위해 MRI 스캔에 적용된 CNN을 이용해 확장기 및 수축기 사이의 차이를 측정하여 박출률을 계산
    • 1p/19q 염색체 공동 삭제 상태를 파악하기 위해 LGG(저등급 교종)의 MRI 스캔에 CNN을 적용

    이 과정을 완료하면 다양한 의료 작업 수행을 위해 MRI 스캔에 CNN을 적용할 수 있게 됩니다.

  • 의료 유전체학을 위한 딥 러닝

    전제 조건: CNN 및 Python에 대한 기본적인 경험

    프레임워크: Caffe, TensorFlow, Theano

    언어: 영어

    인증 가능

    이 과정은 염색체 공동 삭제를 감지하고 유전체 서열에서 모티프를 찾기 위해 딥 러닝을 적용하는 방법을 교육합니다. 학습 내용

    • 나선형 신경망(CNN)의 기초와 그 작용 기전에 대한 이해
    • 1p/19q 염색체 공동 삭제 상태를 파악하기 위해 LGG(저등급 교종)의 MRI 스캔에 CNN을 적용
    • 유전체 데이터를 시뮬레이션하고 모티프를 찾기 위해 DragoNN 툴킷을 이용

    이 과정을 완료하면 CNN의 작용 기전을 이해하고 CNN을 이용한 MRI 이미지를 평가하고 새로운 모티프 연구를 위해 실제 유전체 조절 데이터를 이용할 수 있게 됩니다.

대학교 앰배서더 프로그램

인증을 받은 교육 기관은 대학 캠퍼스에서 교수, 학생, 연구자를 대상으로 DLI 워크샵을 무료로 교육할 수 있습니다.

전 세계 유명 대학에서 진행되는 DLI 대학교 앰배서더 프로그램에 참여하십시오. 그리고 강의 자료, 실습, GPU 클라우드 리소스 등을 위해 NVIDIA 교육 키트를 다운로드하십시오.

참여 대학교

Arizona State University
Columbia
The Hong Kong University Of Science And Technology
Massachusetts Institute of Technology
NUS - National University of Singapore
University of Oxford

추가적인 딥 러닝 교육

DLI는 최고의 교육 기관과의 협력을 통해 전 세계의 개발자 및 데이터 과학자들로 딥 러닝 교육의 범위를 확장하고 있습니다.