NVIDIA Deep Learning Institute

세계에서 가장 어려운 문제를 해결하도록 교육을 제공합니다.

NVIDIA DLI(Deep Learning Institute)는 실제 문제를 해결할 수 있도록 AI 및 가속 컴퓨팅 분야의 핸즈온 세션을 제공합니다. 클라우드에서 GPU 기반으로 진행되는 온라인 자율학습과 Instructor 주도 교육을 통해 개발자, 데이터 과학자, 연구자, 학생이 실용적인 경험을 얻고 직업적 성장을 뒷받침할 역량에 대한 인증서를 받을 수 있습니다. 또한 기업 경영진과 대학 교육자를 위한 리소스도 제공하고 있습니다.

  • <span style=

    개발자

  • <span style=

    경영진

  • <span style=

    교육자

  • <span style=

    학생

 프로젝트에 AI를 적용하는 방법과 CUDA OpenACC. 를 통해 애플리케이션을 가속화하는 방법을 알아보십시오. 핸즈온 세션을 통해 작업에 대한 실용적인 기술을 얻고 주제 관련 역량에 대한 인증서를 취득하십시오.

DLI를 통한 온라인 교육

클라우드에서 완전히 구성된 GPU 가속화 워크스테이션에 액세스하여 장소 및 시간에 구애받지 않고 온라인 핸즈온 자율학습에 몰두해 보십시오. 엔드 투 엔드 프로젝트 구현 및 배포를 위한 8시간 과정이나 특정 기술이나 기법을 적용하기 위한 2시간 과정 중에서 선택하십시오. 대부분의 온라인 8시간 과정에서는 직업적 성장을 뒷받침하기 위해 주제 관련 역량에 대한 인증서를 제공합니다.

인증서 제공

딥 러닝 과정

딥 러닝을 처음 접하신다면, 현실 세계의 문제를 해결하기 위해 신경망을 학습 및 배포하는 방법을 배우는 기본 과정에서 시작하십시오. 딥 러닝에 대한 기초 지식을 습득하였으면 이제 고급 과정인 산업별 DLI 교육에 지식을 적용할 수 있습니다.

딥 러닝 기초 과정

  • 컴퓨터 비전을 위한 딥 러닝의 기초  

    전제 조건: 함수 및 변수와 같은 기본 프로그래밍 기초에 대한 지식

    프레임워크: Caffe, DIGITS

    평가 유형: 코드 기반

    소요 시간: 8시간

    언어: 영어

    비용: $90

    인증서 제공

    성능 및 기능을 개선하기 위해 신경망을 학습하고 결과를 이용하면서 딥 러닝의 기초적인 내용을 살펴봅니다.

    이 과정에서는 신경망을 학습 및 배포하면서 딥 러닝의 기초를 배웁니다. 학습 내용

    • 이미지 분류 및 물체 감지 등의 일반적인 딥 러닝 워크플로우 구현
    • 성능 및 기능 향상을 위해 데이터, 학습 매개변수, 네트워크 구조 및 기타 전략을 이용해 실험
    • 실제 세상의 문제를 해결하기 시작하기 위해 신경망 배포

    이 과정을 완료하면 딥 러닝 관련 문제를 스스로 해결하기 시작할 수 있습니다.

  • DIGITS를 통한 이미지 분류

    전제 조건: 없음

    프레임워크: Caffe(DIGITS 인터페이스 포함)

    소요 시간: 2시간

    언어: 영어, 중국어, 일본어

    비용: $30

    딥 러닝은 일반 코딩 방법을 사례 기반의 학습으로 제작된 모델로 대체하여 전적으로 새로운 솔루션을 가능하게 합니다. 다음을 통해 심층 신경망을 교육하여 수기 문자를 인식합니다.

    • 교육 환경으로 이미지 데이터 로딩
    • 네트워크 선택 및 교육
    • 새 데이터로 테스트하고 성능을 개선하기 위해 반복

    이 과정을 완료하면 교육을 위해 사용해야 하는 데이터를 평가할 수 있습니다.

  • DIGITS 기반의 물체 탐지

    전제 조건: 신경망에 대한 기본적인 경험

    프레임워크: Caffe(DIGITS 인터페이스 포함)

    소요 시간: 2시간

    언어: 영어, 중국어

    비용: $30

    다음과 같이 항공 이미지에서 전체 얼굴을 감지하는 과제를 통해 물체 감지에 딥 러닝을 적용하는 방법을 배웁니다.

    • 기존 컴퓨터 비전과 딥 러닝 결합
    • 딥 러닝 프레임워크인 Caffe를 사용하여 기존 신경망에 부차적인 "뇌 수술" 수행
    • 용도에 맞게 제작된 네트워크와 라벨이 있는 엔드 투 엔드 데이터를 식별 및 이용함으로써 딥 러닝 커뮤니티의 지식 활용

    이 과정을 완료하면 딥 러닝으로 커스텀 문제를 해결할 수 있습니다.

  • TensorRT를 활용한 TensorFlow 모델의 최적화 및 배포

    전제 조건: TensorFlow 및 Python 사용 경험

    프레임워크: TensorFlow, Python, TensorRT - TF-TRT

    소요 시간: 2시간

    언어: 영어

    비용: $30

    TensorRT에 내장 된 TensorRT 라이브러리 (TF-TRT) 및 Python을 사용하여 TensorFlow 고성능 딥 러닝 모델을 생성하는 기본 절차에 대해 학습합니다. 본 강의를 통해서 아래의 사항을 학습할 수 있습니다 :

    • 분류 모델을 전처리하고 배포하기 위해 그래프 및 가중치를 최적화하는 방법에 대해 학습합니다.
    • FP32, FP16 및 INT8정밀도를 사용하여 그래프 최적화 및 기초적인 양자화에 대해 학습합니다.
    • TF-TRT API를 사용하여 그래프를 최적화하고 모델에 가장 잘 맞는 최적화 변수를 선택합니다.
    • 지원되지 않는 레이어 문제를 해결하고 모델을 최적화하기 위해 Python에서 사용자 지정 레이어를 제적하고 포함합니다.

    학습을 완료하면 TF-TRT를 활용하여 배포 용도로 최적화 된 모델을 얻는 방법을 이해하게 될 것입니다.

  • TensorFlow, MXNet, NVIDIA Docker를 통한 딥 러닝 워크플로우

    전제 조건: bash 터미널에 대한 기본적인 경험

    프레임워크: TensorFlow, MXNet

    소요 시간: 2시간

    언어: 영어, 중국어

    비용: $30

    NVIDIA Docker 플러그인을 통해 GPU를 사용하여 생산 등급 딥 러닝 워크플로우를 컨테이너화할 수 있습니다. 다음을 통해 호스트 구성 및 관리를 절감하는 방법을 배웁니다.

    • Docker 이미지로 작업하고 컨테이너 라이프스타일을 관리하는 방법 학습
    • 구성 가능한 경량 컨테이너를 생성하는 경우 재사용을 극대화하기 위해 공개 Docker 이미지 레지스트리인 DockerHub의 이미지에 액세스
    • TensorFlow 및 MXNet 프레임워크 모두를 사용하여 신경망 교육

    이 과정을 완료하면 딥 러닝용으로 사전 구성된 이미지를 컨테이너화 및 배포할 수 있습니다.

  • RAPIDS를 통한 데이터 과학 워크플로우 가속화

    전제 조건: Pandas, NumPy 및 scikit-learn에 대한 고급 역량

    프레임워크: 없음

    소요 시간: 2시간

    언어: 영어

    비용: $3

    오픈소스 RAPIDS 프로젝트를 통해 과학자는 처음부터 끝까지 데이터 과학 및 데이터 분석 애플리케이션을 GPU 가속할 수 있습니다. 그래서 CPU만 활용하는 기존 워크플로우로는 불가능한 크게 향상된 성능 이점과 기술의 가능성을 실현할 수 있습니다.

    데이터 과학 애플리케이션을 GPU 가속화하는 방법 알아보기:

    • cuDF(Pandas와 유사한 GPU 지원 데이터 프레임) 및 cuML(GPU 가속화 머신 러닝 알고리즘) 등의 핵심 RAPIDS 라이브러리 활용
    • GPU 가속화로 가능해진 신속한 반복 주기를 통해 제공되는 엔드 투 엔드 데이터 과학에 대한 접근 방식과 기법 학습
    • 리팩토링을 위한 API 특정 및 모범 사례를 포함한 CPU 중심 및 GPU 중심 데이터 과학 간의 주요한 차이점 이해

    이 과정을 완료하면 기존 CPU 전용 데이터 과학 워크로드를 리팩토링해 GPU에서 훨씬 빠르게 실행하고 처음부터 가속화된 데이터 과학 워크플로우를 쓸 수 있게 됩니다.

  • TensorFlow를 통한 이미지 분할

    전제 조건: 신경망에 대한 기본적인 경험

    프레임워크: TensorFlow

    소요 시간: 2시간

    언어: 영어

    비용: $30

    이미지(또는 의미론적) 세분화는 이미지의 각 픽셀을 특정 클래스로 배치하는 작업입니다. 다음을 통해 MRI 이미지를 세분화하여 심장의 각 부분을 측정하는 방법을 배웁니다.

    • 이미지 세분화를 다른 컴퓨터 비전 문제와 비교
    • TensorBoard 및 TensorFlow Python API와 같은 TensorFlow 도구로 실험
    • 모델 성능을 평가하기 위해 효과적인 지표를 구현하는 방법 학습

    이 과정을 완료하면 딥 러닝을 사용하여 대부분의 컴퓨터 비전 워크플로우를 설정할 수 있습니다.

  • Microsoft Cognitive Toolkit을 통한 이미지 분류

    전제 조건: 없음

    프레임워크: Microsoft Cognitive Toolkit

    소요 시간: 2시간

    언어: 영어

    비용: $30

    Microsoft Cognitive Toolkit 프레임워크를 이용해 신경망을 교육하는 방법을 배웁니다. 점점 더 복잡해지는 네트워크를 구축 및 교육하여 다음을 수행합니다.

    • BrainScript의 “Simple Network Builder”를 사용하는 신경망 표현식과 보다 일반화할 수 있는 “Network Builder”를 사용하는 신경망 표현식의 비교
    • 신경망 그래프 시각화
    • 신경망을 교육 및 테스트하여 수기 문자 분류

    이 과정을 완료하면 나선형 신경망(CNN)의 기본 지식을 습득하고 더욱 향상된 Microsoft Cognitive Toolkit 사용으로 이행할 수 있습니다.

  • TensorFlow를 통한 선형 분류

    전제 조건: 없음

    프레임워크: TensorFlow

    소요 시간: 2시간

    언어: 영어

    비용: $30

    TensorFlow의 TFLearn API를 이용해 구조화된 데이터로부터 예측을 도출하는 방법을 배웁니다. 인구 조사 데이터가 주어지면 개인 수입을 예측하는 과제를 통해 다음을 수행합니다.

    • 머신 러닝을 위해 CSV에서 데이터 로드, 보기 및 정리
    • 신경망의 기능 및 라벨(입력, 출력)로 기존 데이터 세트 분할
    • 선형에서 심층에 이르는 모델 구축 및 성능 차이 평가

    이 과정을 완료하면 자신의 구조화된 데이터에서 예측을 도출할 수 있습니다.

  • DIGITS를 통한 신호 처리

    전제 조건: 신경망 교육에 대한 기본적인 경험

    프레임워크: Caffe, DIGITS

    소요 시간: 2시간

    언어: 영어, 중국어

    비용: $30

    심층 신경망은 인간보다 이미지 분류 능력이 더 뛰어나며 이는 컴퓨터 비전에서 기대하는 바를 뛰어 넘습니다. 노이즈로 손상된 약한 신호를 감지하기 위해 무선 주파수(RF) 신호를 이미지로 변환하는 방법을 배웁니다. 학습 내용:

    • 비이미지 데이터를 이미지 데이터로 처리
    • DIGITS에서 딥 러닝 워크플로우(로드, 교육, 테스트, 조정) 구현
    • 프로그래밍 방식으로 성능을 테스트하고 성능 개선 사항 안내

    이 과정을 완료하면 딥 러닝을 사용하여 이미지 및 유사 이미지 데이터 모두를 분류할 수 있습니다.

디지털 콘텐츠 제작을 위한 딥 러닝

  • GAN(General Adversarial Network)을 TensorFlow 및 DIGITS와 함께 사용해 이미지 생성

    전제 조건: CNN에 대한 경험

    프레임워크: TensorFlow

    소요 시간: 2시간

    언어: 영어

    비용: $30

    DIGITS에서 이미지 콘텐츠를 생성하기 위해 GAN(Generative Adversarial Network)을 교육하는 방법을 배웁니다. 학습 내용:

    • GAN을 사용하여 수기 숫자 생성
    • 기능 공간을 시각화하고 속성 벡터를 사용하여 이미지 아날로지 생성
    • GAN을 교육하여 설정된 속성으로 이미지 생성

    이 과정을 완료하면 GAN을 사용하여 기능 공간을 조작함으로써 이미지를 생성할 수 있습니다.

  • Torch를 통한 이미지 스타일 전송

    전제 조건: CNN에 대한 경험

    프레임워크: TensorFlow

    소요 시간: 2시간

    언어: 영어

    비용: $30

    특이한 시각적 특징을 추출함으로써 한 이미지의 외관과 느낌을 다른 이미지로 전달하는 방법을 탐색합니다. 기능 추출을 위해 나선형 신경망(CNN)이 사용되는 방법과 이러한 기능이 새 이미지를 생성하는 생성자에 제공되는 방법을 확인하십시오. 학습 내용:

    • 특이한 시각적 특징을 추출함으로써 한 이미지의 외관과 느낌을 다른 이미지로 전달
    • 다양한 기술을 사용하여 스타일이 올바르게 전송되는지 여부를 정성적으로 확인
    • 임의의 스타일 전송을 위해 아키텍처 혁신 및 교육 기술 사용

    이 과정을 완료하면 신경망을 사용하여 비디오에 효과적인 속도로 임의의 스타일을 전송할 수 있습니다.

  • 오토인코더를 이용해 렌더링된 이미지의 노이즈 제거

    전제 조건: CNN에 대한 경험

    프레임워크: TensorFlow

    소요 시간: 2시간

    언어: 영어

    비용: $30

    광선 추적된 이미지의 노이즈 제거 속도를 대폭 높이는 데 오토인코더가 포함된 신경망이 어떻게 사용될 수 있는지 배웁니다. 학습 내용:

    • 렌더링된 이미지에 노이즈가 있는지 파악
    • 사전 트레이닝된 네트워크를 사용하여 일부 샘플 이미지 또는 자체 이미지에서 노이즈 제거
    • 제공된 데이터 세트를 사용하여 자체 노이즈 제거기 교육

    이 과정을 완료하면 신경망 내부에서 오토인코더를 사용하여 자체 렌더링된 이미지 노이즈 제거기를 교육할 수 있습니다.

  • 오토인코더를 사용한 이미지 초고해상도

    전제 조건: CNN에 대한 경험

    프레임워크: Keras

    소요 시간: 2시간

    언어: 영어

    비용: $30

    오토인코더를 통해 신경망의 힘을 활용하여 저품질 원본 이미지로 고품질 이미지를 만드십시오. 단축 과정 학습 내용:

    • 오토인코더를 이해하고 디자인합니다
    • 이미지 품질을 엄밀히 측정하는 다양한 방법을 배웁니다

    이 과정을 완료하면 신경망 내부에서 오토인코더를 사용하여 품질을 상당히 개선할 수 있습니다.

의료 서비스용 딥 러닝

  • Keras에서 회귀 신경망을 사용하여 시계열 데이터 모델링

    전제 조건: 딥 러닝에 대한 기본적인 경험

    프레임워크: Keras

    소요 시간: 2시간

    언어: 영어

    비용: 무료

    비용: $30

    회귀 신경망(RNN)을 이용하여 모델을 통해 자연 언어, 시장, 시간 경과에 따른 환자의 건강과 같은 시계열 데이터를 분류 또는 예측할 수 있습니다. 학습 내용:

    • HDF5(계층적 데이터 형식 버전 5)에서 전자 건강 기록을 사용하여 교육 및 테스트 데이터 세트 생성
    • 회귀 신경망과 함께 사용하기 위해 데이터 세트를 준비하여 매우 복잡한 데이터 시퀀스의 모델링 허용
    • Theano 위에서 실행하는 Keras 라이브러리를 사용해 LSTM(Long-Short Term Memory) 모델, 특정 RNN 아키텍처를 구성하여 기준 데이터에 대해 모델 성능 평가

    이 과정을 완료하면 RNN을 사용하여 시계열 데이터를 모델링할 수 있습니다.

  • MedNIST 데이터 세트를 사용하여 의료 영상 분류

    전제 조건: 없음

    프레임워크: DIGITS

    소요 시간: 2시간

    언어: 영어

    방사선학 및 의료 영상 딥 러닝에 대한 실용적인 핸즈온 입문 과정을 확인하십시오. 학습 내용:

    • 의료 영상 데이터 수집, 형식 지정 및 표준화
    • 데이터 세트에서 나선형 신경망(CNN) 설계 및 교육
    • 트레이닝된 모델을 사용하여 새로운 의료 영상 분류

    이 과정을 완료하면 의료 영상 데이터 세트에서 영상을 분류하기 위해 CNN을 적용할 수 있습니다.

  • 의료 응용 분야에서의 딥 러닝을 위한 데이터 과학 워크플로우

    전제 조건: Python 및 CNN에 대한 기본적인 경험

    프레임워크: PyTorch

    소요 시간: 2시간

    언어: 영어

    비용: $30

    의료 데이터 세트는 딥 러닝 애플리케이션에 대한 특별한 과제를 제시합니다. 다음을 수행합니다.

    · 데이터 증강 및 표준화의 입문 기법 학습
    · 단순한 의료 영상 데이터 세트에 이러한 기법을 적용해 실험
    · 증강 데이터 세트에 대해 나선형 신경망을 교육해 본인의 기법을 검증

    이 과정을 완료하면 의료 영상 데이터 세트에 단순한 데이터 조작 기법을 적용할 수 있습니다.

  • DIGITS를 사용한 의료 이미지 세분화

    전제 조건: CNN 및 Python에 대한 기본적인 경험

    프레임워크: DIGITS, Caffe

    소요 시간: 2시간

    언어: 영어

    비용: $30

    이미지(또는 의미론적) 세분화는 이미지의 각 픽셀을 특정 클래스로 배치하는 작업입니다. 다음을 통해 MRI 이미지를 세분화하여 심장의 각 부분을 측정하게 됩니다.

    • 맞춤형 Python 레이어를 통해 Caffe 확장
    • Transfer 러닝 프로세스 구현
    • 널리 사용되는 이미지 분류 네트워크를 통해 완전한 나선형 신경망(CNN) 구축

    이 과정을 완료하면 딥 러닝을 사용하여 대부분의 컴퓨터 비전 워크플로우를 설정할 수 있습니다.

  • TensorFlow를 통한 이미지 분류: 레디오믹—1p19q 염색체 상태 분류

    전제 조건: CNN 및 Python에 대한 기본적인 경험

    프레임워크: TensorFlow

    소요 시간: 2시간

    언어: 영어

    비용: $30

    Mayo Clinic에서 실시 중인 연구 덕분에 딥 러닝 기술을 사용하여 MRI 이미지에서 레디오믹을 감지함으로써 뇌종양 환자를 더 효과적으로 치료하고 더 좋은 결과를 제공할 수 있게 되었습니다. 다음을 통해 1p19q 공동 삭제 바이오마커를 감지하는 방법을 배웁니다.

    • 나선형 신경망(CNN)을 디자인하고 교육합니다
    • 이미징 유전체학(레디오믹)을 사용하여 외과적 생체 조직 검사 없이 병의 유전체학을 식별하는 바이오마커를 생성합니다
    • Mayo Clinic에서 진행되는 방사선 유전체학 연구를 살펴봅니다

    이 과정을 완료하면 딥 러닝을 사용한 레디오믹 예측의 참신함과 유망한 결과에 대한 자신만의 통찰력을 갖게 됩니다.

  • R 및 MXNet을 통한 의료 이미지 분석

    전제 조건: CNN 및 Python에 대한 기본적인 경험

    프레임워크: MXNet

    소요 시간: 2시간

    언어: 영어

    비용: $30

    나선형 신경망(CNNs)을 의료 이미지 분석에 적용하여 비가시적 이미지로 환자 상태를 추론할 수 있습니다. CNN을 교육하여 시계열 MRI 데이터를 통해 인간 심장의 좌심실 용적을 추론하는 방법을 알아보십시오. 학습 내용:

    • 기존의 2D CNN을 더 복잡한 데이터로 확장합니다
    • 표준 Python API 및 R을 통해 MXNet을 사용합니다
    • 용적 측정의 성격을 가지며 일시적 구성 요소를 가질 수 있는 고차원 이미지를 처리합니다

    이 과정을 완료하면 비가시적 이미지를 위해 CNN을 사용할 수 있습니다.

  • 의료 영상을 위한 Generative Networks를 통한 데이터 증강 및 세분화

    전제 조건: CNN에 대한 경험

    프레임워크: TensorFlow

    소요 시간: 2시간

    언어: 영어

    비용: $30

    GAN(Generative Adversarial Network)은 제공된 트레이닝 데이터에 기반하여 새로운 예제를 생성하는 생성자와, 원본 데이터와 시뮬레이션된 데이터를 구분하려 시도하는 판별자로 이루어진 한 쌍의 심층 신경망입니다. 두 네트워크가 함께 성장함에 따라 생성되는 예시는 점점 더 현실적으로 변할 것입니다. 이 기술은 기존 네트워크의 트레이닝을 위한 규모가 작은 데이터 세트를 증강할 수 있으므로 의료 분야에서 전도유망합니다. 학습 내용:

    • 뇌의 합성 MRI 생성
    • 세분화를 위해 GAN 적용
    • 정확도를 높이기 위한 데이터 증강에 GAN 활용

    이 과정을 완료하면 의료 영상 사용 사례에 GAN을 적용할 수 있게 됩니다.

  • 의료 영상을 위한 CFCM(Coarse-to-Fine Contextual Memory)

    전제 조건: CNN에 대한 경험

    프레임워크: TensorFlow

    소요 시간: 2시간

    언어: 영어

    비용: $30

    CFCM은 매우 심층적인 아키텍처를 사용하고 서로 다른 많은 스케일의 기능을 나선형의 LSTM(Long short-term memory)과 통합하는 이미지 세분화를 위해 개발된 기술입니다. 학습 내용:

    • 의료 이미지 세분화를 위한 인코더-디코더 아키텍처에 대한 심도 있는 검토
    • 일반적인 빌딩 블록(나선형, 풀링 레이어, 잔존 넷 등)에 대해 이해
    • Skip Connection을 위한 다양한 전략 조사

    이 과정을 완료하면 의료 영상 세분화 및 유사한 이미징 작업에 CFCM 기술을 적용할 수 있게 됩니다.

  • Keras, Theano와 DragoNN을 사용한 유전체학용 딥 러닝

    전제 조건: 나선형 신경망(CNN) 및 Python에 대한 기본적인 경험

    프레임워크: Keras, Theano

    소요 시간: 2시간

    언어: 영어

    비용: $30

    딥 러닝 모델을 해석하여 예측 가능한 유전체 서열 패턴을 찾는 방법을 알아보십시오. 다음의 목적으로 딥 유전체 조절 유전체학 신경망(DragoNN) 툴킷을 시뮬레이션된 조절 유전체학 데이터와 실제 조절 유전체학 데이터에 대해 사용합니다.

    • 널리 사용되는 DragoNN 아키텍처를 쉽게 이해합니다
    • DragoNN 모델을 사용하여 조절 서열을 모델링하고 해석하기 위한 가이드라인을 살펴봅니다
    • 유전체학 및 고성능 모델의 문제 식별에 있어 언제 DragoNN이 탁월한 선택인지 파악합니다

    이 과정을 완료하면 예측 가능한 유전체 서열 패턴 발견을 사용해 새로운 생물학적 통찰력을 얻을 수 있습니다.

지능적 비디오 분석을 위한 딥 러닝

  • TensorRT를 사용한 지능적 비디오 분석을 위한 배포

    전제 조건: CNN 및 C++에 대한 기본적인 경험

    프레임워크: TensorRT

    소요 시간: 2시간

    언어: 영어

    비용: $30

    교육된 신경망에 새로 입력된 데이터에 대한 답을 찾도록 임무를 부여하는 것을 배포라고 부릅니다. TensorRT는 신경망의 추론 성능을 개선하는 다양한 옵션을 갖춘 기본적인 배포 도구입니다. 단축 과정 학습 내용

    • giexec를 사용해 추론을 실행하는 방법을 배웁니다.
    • 혼합된 정밀 INT8을 사용해 추론을 최적화합니다.
    • 플러그인을 위해 맞춤형 레이어 API를 활용합니다.

    이 과정을 완료하면 TensorRT를 사용해 신경망을 위한 추론 성능을 가속화할 수 있습니다.

  • DeepStream을 통한 인텔리전트 비디오 분석을 위한 AI 워크플로우

    전제 조건: C++ 및 Gstreamer에 대한 경험

    프레임워크: DeepStream3

    소요 시간: 2시간

    언어: 영어

    비용: $30

    DeepStream 3.0 프레임워크에는 인텔리전트 비디오 분석(IVA) 애플리케이션의 하드웨어 가속화된 빌딩 블록이 포함됩니다. 그래서 개발자는 핵심 딥 러닝 네트워크 구축에 집중할 수 있습니다. DeepStream SDK는 다양한 사용 사례를 실증하며 배포 미디어에 유연성을 제공합니다.

    다음과 같은 내용을 배울 수 있습니다.

    · 병렬식 멀티 스트림 비디오 처리를 위해 DeepStream 파이프라인을 배포하며 대규모의 최대 처리량을 감당하는 애플리케이션을 제공
    · 처리 파이프라인을 구성하고 직관적인 그래프 기반 애플리케이션을 생성. 여러 딥 네트워크 모델을 활용해 비디오 스트림을 처리하고 더욱 지능적인 통찰력을 확보

    이 과정을 완료하면 DeepStream을 이용해 AI 기반 비디오 분석 애플리케이션을 생성해 비디오 스트림을 실행 가능한 통찰력으로 변환하는 방법을 알게 됩니다.

가속 컴퓨팅 코스

가속 컴퓨팅을 처음 접하신다면 CUDA 및 OpenACC를 통해 애플리케이션을 가속화하는 방법을 학습해 시작하십시오.

  • CUDA C/C++를 사용한 가속 컴퓨팅의 기초 

    전제 조건: 변수 유형, 루프, 조건문, 함수 및 어레이 처리에 대한 지식을 포함하는 기본 C/C++ 능력 CUDA 프로그래밍 지식은 필요하지 않습니다.

    평가 유형: 코드 기반

    소요 시간: 8시간

    언어: 영어, 중국어, 일본어, 한국어

    인증 가능

    CUDA 컴퓨팅 플랫폼은 세계에서 가장 빠른 초병렬 GPU에서 실행할 수 있도록 CPU 전용 애플리케이션의 가속화를 지원합니다. 다음에 의한 C/C++ 애플리케이션 가속화를 경험

    • GPU에서 잠재 병렬 처리를 실행하기 위해 CPU 전용 애플리케이션 가속화
    • 가속화된 애플리케이션을 최적화하기 위해 필수적인 CUDA 메모리 관리 기법 활용
    • 가속화된 애플리케이션의 동시 실행에 대한 잠재성을 노출하고 CUDA 스트림으로 이를 활용
    • 명령줄과 시각적 프로파일링을 활용해 작업을 안내 및 확인

    이 과정을 완료하면 가장 필수적인 CUDA 도구 및 기술을 이용해 기본 C/C++ CPU 전용 애플리케이션을 가속화 및 최적화할 수 있게 됩니다. 가속화된 애플리케이션을 빠르게 출시할 수 있는 CUDA 개발의 반복적 스타일을 이해할 수 있으실 것입니다.

  • CUDA Python을 사용한 가속 컴퓨팅의 기초

    전제 조건: 변수 유형, 루프, 조건문, 함수 및 어레이 처리에 대한 지식을 포함하는 기본 Python 능력 ndarrays 및 ufuncs 사용을 포함하는 NumPy 능력. CUDA 프로그래밍 지식은 필요하지 않습니다.

    평가 유형: 코드 기반

    소요 시간: 8시간

    언어: 영어

    비용: $90

    인증 가능

    인증서 제공

    이 과정에서는 적시 생산형의 유형 특화 Python 함수 컴파일러인 Numba를 사용하여 초병렬 NVIDIA GPU에서 Python 프로그램을 가속화하는 방법을 알아봅니다. 학습 내용

    • Numba를 사용해 NumPy 전역 함수(ufuncs)에서 CUDA 커널을 컴파일
    • Numba를 사용해 커스텀 CUDA 커널을 생성 및 시작
    • 핵심 GPU 메모리 관리 기법을 적용

    이 과정을 완료하면 Numba를 사용해 CUDA 커널을 컴파일 및 실행하여 NVIDIA GPU 상에서 Python 애플리케이션을 가속화할 수 있습니다.

  • OpenACC를 사용한 가속 컴퓨팅의 기초

    전제 조건: C/C++에 대한 기본적인 경험

    소요 시간: 8시간

    언어: 영어

    비용: $90

    GPU에서의 프로그래밍을 위해 높은 수준의 프로그래밍 언어인 OpenACC의 기초를 배웁니다. 이 과정은 C/C++에 대한 경험이 약간 있으며 CPU 전용 프로그래밍의 한계를 넘어선 애플리케이션 성능 가속화에 관심이 있는 모든 사람들 위한 것입니다. 과정 학습 내용

    • OpenACC로 기존 애플리케이션을 가속화하는 간단한 4단계 방법
    • OpenACC 코드베이스를 프로파일링하고 최적화하는 방법
    • OpenACC를 MPI(메시지 전달 인터페이스)와 결합하여 다중 GPU 시스템에서 프로그래밍하는 방법

    이 과정을 완료하면 OpenACC, CUDA 인식 MPI, NVIDIA 프로파일링 도구의 조합을 사용하여 복수의 GPU 클러스터에서 가속화된 이종 애플리케이션을 구축하고 최적화할 수 있습니다.

  • CUDA C/C++를 통한 애플리케이션 가속화

    전제 조건: C/C++에 대한 기본적인 경험

    언어: 영어, Japanese

    소요 시간: 2시간

    비용: 무료

    비용: $30

    CUDA를 이용해 C/C++ 애플리케이션을 가속화함으로써 초병렬 NVIDIA GPU의 성능을 활용하는 방법을 배웁니다. 다음을 위해 CUDA로 프로그래밍하는 방법을 학습합니다.

    • SAXPY 알고리즘 가속화
    • 행렬 곱셈 알고리즘 가속화
    • 열전도 알고리즘 가속화

    이 과정을 완료하면 CUDA 플랫폼을 사용하여 C/C++ 애플리케이션을 가속화할 수 있습니다.

  • OpenACC – 4단계로 2배 가속화

    전제 조건: C/C++에 대한 기본적인 경험

    언어: 영어

    소요 시간: 2시간

    비용: 무료

    비용: $30

    OpenACC를 이용해 C/C++ 또는 Fortran 애플리케이션을 가속화함으로써 초병렬 NVIDIA GPU의 성능을 활용하는 방법을 배웁니다. OpenACC는 가속기 코드를 직접 작성하는 대신 코드를 가속화하기 위해 컴파일러 힌트를 제공하는 지침 기반 컴퓨팅 접근 방법입니다. OpenACC를 이용해 애플리케이션을 가속화하기 위한 4단계 프로세스를 지금 시작하십시오.

    • 애플리케이션 특성 분석 및 프로파일링
    • 컴퓨팅 지침 추가
    • 데이터 이동을 최적화하는 지침 추가
    • 커널 스케줄링을 사용하여 애플리케이션 최적화

    이 과정을 완료하면 OpenACC 지침을 사용하여 C/C++ 애플리케이션을 빠르게 가속화하는 프로필 중심 접근 방법을 사용할 수 있습니다.

  • 가속 컴퓨팅 소개

    전제 조건: C/C++에 대한 기본적인 경험

    언어: 영어

    소요 시간: 2시간

    비용: $30

    GPU의 코드 가속화를 위한 3가지 기술 탐색:

    • GPU 가속화 라이브러리 사용
    • OpenACC와 같은 컴파일러 지침 사용
    • CUDA 지원 언어로 직접 코드 작성

    이 과정을 완료하면 GPU 이식의 잠재적인 속도 향상과 사용 편의성을 입증하는 방법을 이해할 수 있습니다.

  • CUDA C/C++를 통한 GPU 메모리 최적화

    전제 조건: C/C++에 대한 기본적인 경험

    언어: 영어

    소요 시간: 2시간

    비용: $30

    NVIDIA GPU 상에서 CUDA C/C++로 프로그래밍하기 위한 메모리 최적화 기법과 이러한 최적화를 뒷받침하기 위해 NVVP(NVIDIA Visual Profiler)를 사용하는 방법을 탐색합니다. 학습 내용:

    • 기본 행렬 전치 알고리즘 구현
    • NVVP로 알고리즘을 프로파일링하는 여러 주기를 수행하고 성능을 최적화

    이 과정을 완료하면 글로벌 및 공유 메모리 액세스 패턴을 분석 및 개선하는 방법, 가속화 C/C++ 애플리케이션을 최적화하는 방법을 알 수 있습니다.

  • C/C++의 GPU 가속화 라이브러리를 통한 애플리케이션 가속화

    전제 조건: “CUDA C/C++를 통한 애플리케이션 가속화” 또는 이와 유사한 경험을 보유

    언어: 영어

    소요 시간: 2시간

    비용: $30

    드롭인 라이브러리를 사용해 C/C++ 애플리케이션을 가속화함으로써 초병렬 NVIDIA GPU의 성능을 활용하는 방법을 배웁니다. 다음 방법을 포함하여 3가지 연습을 수행합니다.

    • cuBLAS를 사용해 기본 행렬 곱셈 가속화
    • 일부 cuRAND API 호출을 이전 cuBLAS 호출에 추가하여 라이브러리 결합
    • nvprof를 사용하여 코드를 프로파일링하고 일부 CUDA 런타임 API 호출로 최적화

    이 과정을 완료하면 기존 CPU 전용 C/C++ 프로그램에서 신속한 애플리케이션 가속화를 위해 여러 CUDA 지원 라이브러리를 활용할 수 있습니다.

  • Python의 GPU 가속화 라이브러리를 통한 애플리케이션 가속화

    전제 조건: Python에 대한 기본적인 경험

    언어: 영어

    소요 시간: 2시간

    비용: $30

    다음을 통해 GPU 라이브러리를 이용하여 NVIDIA GPU에서 Python 코드를 가속화하는 방법을 배웁니다.

    • cuRAND 라이브러리를 이용해 Monte Carlo 프라이서 가속화
    • CPU와 GPU 간 데이터 이동 최적화

    이 과정을 완료하면 GPU 가속화 Python 라이브러리를 이용해 CPU 전용 Python 코드 가속화를 시작할 수 있습니다.

  • Thrust를 이용한 C++를 가속화

    전제 조건: “CUDA C/C++를 통한 애플리케이션 가속화” 또는 이와 유사한 경험을 보유

    언어: 영어

    소요 시간: 2시간

    비용: $30

    Thrust는 대략적으로 C++ 표준 템플릿 라이브러리를 기반으로 하는 병렬 알고리즘 라이브러리입니다. 개발자가 병렬 컴퓨팅의 성능을 빠르게 수용하도록 하고 OpenMP 및 Intel의 스레딩 빌딩 블록과 같은 여러 시스템 백엔드를 지원합니다. Thrust를 사용하여 다음을 다루는 연습을 통해 C++을 가속화합니다.

    • 기본 반복자, 컨테이너 및 기능
    • 내장 및 커스텀 기능
    • CPU 처리의 이식성

    이 과정을 완료하면 Thrust 라이브러리의 성능을 활용하여 C/C++ 애플리케이션을 가속화할 수 있습니다.

파트너와 함께하는 온라인 교육

DLI는 최고의 교육 기관과의 협력을 통해 전 세계의 개발자 및 데이터 과학자들로 딥 러닝 교육의 범위를 확장하고 있습니다.

추가 리소스

AI 및 가속화된 컴퓨팅에 관한 광범위한 기술 리소스를 살펴보십시오.

기술 인력에게 AI 및 가속화된 컴퓨팅을 교육하여 경쟁 우위를 유지하십시오. 또한 리소스에 액세스하여 AI가 비즈니스에 미치는 영향에 관해서도 알아보십시오.

Instructor 주도형 교육

DLI는 Instructor 주도형 워크숍을 여러분의 현장에서 제공하여 개발자, 데이터 과학자, 연구자 및 엔지니어로 구성된 팀을 교육합니다. DLI 공인 인스트럭터가 이끄는 전일 워크숍에서는 강의, 엔드 투 엔드 프로젝트의 구현 및 배포를 위한 핸즈온 세션, 주제 관련 역량에 대한 인증서가 제공됩니다.

인증서 제공

딥 러닝 워크숍

팀이 딥 러닝을 처음 접하신다면 현실 세계의 문제를 해결하기 위해 신경망을 학습 및 배포하는 방법을 배우는 기본 과정에서 시작하십시오. 팀이 딥 러닝에 대한 기초 지식을 습득했다면 이제 고급 과정인 산업별 DLI 교육에 지식을 적용할 수 있습니다.

DEEP LEARNING FUNDAMENTALS

  • 컴퓨터 비전을 위한 딥 러닝의 기초 

    전제 조건: 함수 및 변수와 같은 기본 프로그래밍 기초에 대한 지식

    프레임워크: Caffe, DIGITS

    평가 유형: 코드 기반

    언어: 영어, 중국어, 일본어, 한국어

    인증 가능

     

    성능 및 기능을 개선하기 위해 신경망을 학습하고 결과를 이용하면서 딥 러닝의 기초적인 내용을 살펴봅니다.

    이 과정에서는 신경망을 학습 및 배포하면서 딥 러닝의 기초를 배웁니다. 학습 내용

    • 이미지 분류 및 물체 감지 등의 일반적인 딥 러닝 워크플로우 구현
    • 성능 및 기능 향상을 위해 데이터, 학습 매개변수, 네트워크 구조 및 기타 전략을 이용해 실험
    • 실제 세상의 문제를 해결하기 시작하기 위해 신경망 배포

    이 과정을 완료하면 딥 러닝 관련 문제를 스스로 해결하기 시작할 수 있습니다.

  • 여러 데이터 유형에 대한 딥 러닝의 기초 

    전제 조건: “컴퓨터 비전을 위한 딥 러닝의 기초” 또는 이와 유사한 경험을 보유. 기본 python(함수 및 변수)에 대한 지식과 신경망 교육 사전 경험이 요구됩니다.

    프레임워크: TensorFlow

    평가 유형: 선다형 문제

    언어: 영어, 중국어, 일본어, 한국어

    인증 가능

    이 과정에서는 이미지 및 비디오 클립 내의 콘텐츠에 대한 효과적인 설명을 생성하기 위해 나선형 및 회귀 신경망을 결합하는 방법을 살펴봅니다.

    다음을 통해 이미지 및 비디오에서 캡션을 생성하기 위해 TensorFlow 및 MSCOCO(Microsoft Common Objects in Context) 데이터 세트를 이용하여 네트워크를 교육하는 방법을 배웁니다.

    • 이미지 세분화 및 텍스트 생성 등의 딥 러닝 워크플로우 구현
    • 데이터 유형, 워크플로우 및 프레임워크 비교 및 대조
    • 컴퓨터 비전 및 자연어 처리 결합

    이 과정을 완료하면 여러 유형의 데이터 입력이 필요한 딥 러닝 문제를 해결할 수 있게 됩니다.

  • 여러 데이터 유형에 대한 딥 러닝의 기초 

    전제 조건: 신경망 및 Python 프로그래밍에 대한 기본적인 경험, 언어학에 대한 지식

    프레임워크: TensorFlow, Keras

    평가 유형: 코드 기반, 선다형 문제

    언어: 영어, 중국어

    인증 가능

    최신 딥 러닝 기법을 배워 자연어 처리(NLP)를 이용한 텍스트 입력을 이해합니다. 학습 내용:

    • 텍스트를 기계가 인식할 수 있는 표현과 전통적인 접근 방식으로 변환
    • 분산된 표현(임베딩)을 구현하고 그 속성을 이해
    • 한 언어에서 다른 언어로 기계 번역기를 트레이닝

    이 과정을 완료하면 유사한 애플리케이션에서 임베딩을 사용한 NLP에 능숙해질 것입니다.

  • 다중 GPU를 위한 딥 러닝의 기본 

    전제 조건: 확률적 경사 하강법(SGD) 메커니즘을 통한 경험

    프레임워크: TensorFlow

    평가 유형: 코드 기반

    언어: 가능

    인증 가능

    자율 주행 자동차와 같은 AI 애플리케이션을 지원하는 데 사용되는 심층 신경망의 연산 요구 사항은 어마어마합니다. 단일 트레이닝 주기는 단일 GPU에 대해 수 주가 소요되거나 자율 주행 자동차 연구에 사용되는 것과 같은 대규모 데이터 세트에 대해 수년까지 소요될 수 있습니다. 딥 러닝에 다중 GPU를 사용하면 많은 데이터를 트레이닝하는 데 필요한 시간이 크게 단축되므로, 복잡한 문제를 딥 러닝으로 해결할 수 있습니다.

    이 과정은 다중 GPU를 사용하여 신경망을 트레이닝하는 방법을 가르칩니다. 학습 내용:

    • 다중 GPU 트레이닝에 대한 접근 방법
    • 대규모 트레이닝에서 발생하는 알고리즘 및 엔지니어링 문제
    • 위에서 언급한 문제를 극복하는 데 사용되는 주요 기술

    이 과정을 완료하면 TensorFlow를 사용하여 심층 신경망의 트레이닝을 효과적으로 병렬 처리할 수 있습니다.

DEEP LEARNING BY INDUSTRY

  • 자율 주행 자동차를 위한 딥 러닝 - 인지

    전제 조건: CNN에 대한 경험

    프레임워크: TensorFlow, DIGITS, TensorRT

    언어: 영어, 중국어, 일본어

    이 과정에서는 NVIDIA DRIVE PX 개발 플랫폼을 이용하는 자동 주행 차량을 위해 딥 신경망을 설계, 교육 및 배포하는 방법을 배웁니다.

    방법 알아보기

    • DriveWorks 소프트웨어 스택을 이용하여 센서 입력 통합
    • 의미론적 세분화 신경망 교육
    • TensorRT를 이용해 교육을 거친 신경망을 최적화, 검증 및 배포

    이 과정을 완료하면 학생들은 NVIDIA DRIVE PX를 사용하는 자동 주행 차량에 대한 인지 요소를 생성 및 최적화할 수 있습니다.

  • 금융 거래 전략을 위한 딥 러닝

    전제 조건: 신경망에 대한 경험과 금융 산업에 대한 지식

    프레임워크: TensorFlow

    언어: 영어

    주성분 분석(PCA)과 같은 선형 기술은 통계적 차익 거래 전략에 사용하기 위한 ‘고유의 포트폴리오’를 생성할 수단입니다. 시계열 금융 데이터를 이용하는 기타 기술도 널리 보급되어 있습니다. 하지만 이제 거래 전략은 심층신경망의 힘으로 더욱 발전할 수 있습니다.

    과정 학습 내용

    • 시계열 데이터를 준비하고 트레이닝과 테스트 데이터 세트로 네트워크 성능을 테스트
    • 벡터 입력을 읽고 예측하도록 LSTM(Long short-term memory) 네트워크를 구성하고 훈련
    • 오토인코더를 이상 탐지기로 사용하여 차익 거래 전략 수립

    이 과정을 완료하면 시계열 금융 데이터를 활용하여 예측하고 신경망을 이용한 차익 거래로 이익을 남길 수 있습니다.

  • 오토인코더를 사용한 디지털 콘텐츠 생성을 위한 딥 러닝

    전제 조건: CNN과 같은 딥 러닝 개념에 대한 기본 지식과 Python 프로그래밍 언어에 대한 경험

    프레임워크: Torch, TensorFlow

    평가 유형: 선다형 문제

    언어: 영어

    인증 가능

    디지털 콘텐츠 생성을 위한 신경망 설계, 트레이닝 및 배포의 최신 기술에 대해 살펴봅니다. 학습 내용:

    • 임의의 비디오 스타일 전송에 사용되는 아키텍처적 혁신 및 트레이닝 기법 적용
    • 렌더링된 이미지를 위한 자체 노이즈 제거기 트레이닝
    • 초고해상도 AI를 통한 이미지 확대

    이 과정을 완료하면 딥 러닝 접근 방식을 이용해 디지털 자산을 생성할 수 있

  • GAN을 사용한 디지털 콘텐츠 생성을 위한 딥 러닝

    전제 조건: CNN과 같은 딥 러닝 개념에 대한 기본 지식과 Python 프로그래밍 언어에 대한 경험

    프레임워크: TensorFlow, Torch

    평가 유형: 선다형 문제

    언어: 영어

    인증 가능

    인증서 제공

    디지털 콘텐츠 생성을 위한 신경망 설계, 트레이닝 및 배포의 고급 기술에 대해 살펴봅니다. 학습 내용:

    • 이미지 생성을 위한 GAN(Generative Adversarial Network) 교육
    • 하나의 테마에서 다른 테마로 유사 이미지
    • 딥 러닝을 사용하여 텍스트를 이미지로 변환

    이 과정을 완료하면 딥 러닝 접근 방식을 이용해 디지털 자산을 생성할 수 있습니다.

  • 게임 개발을 위한 딥 러닝

    전제 조건: CNN과 같은 딥 러닝 개념에 대한 기본 지식과 Python 프로그래밍 언어에 대한 경험

    프레임워크: TensorFlow, Theano

    평가 유형: 선다형 문제

    언어: 영어, 중국어

    인증 가능

    게임 개발을 위한 신경망 설계, 트레이닝 및 배포의 최신 기술에 대해 학습합니다. 학습 내용:

    • 캐릭터를 애니메이션화하는 위상 기능 신경망 교육
    • 입력 이미지를 출력 이미지로 변환
    • Starcraft 2를 플레이하도록 딥 강화 학습 에이전트 교육

    완료하면 딥 러닝 기술을 게임 개발에 통합하는 다양한 방법을 이해하게 됩니다.

  • 의료 이미지 분석을 위한 딥 러닝

    전제 조건: 심층 신경망에 대한 기본 지식, Python 또는 유사 언어의 기본 코딩 경험

    프레임워크: Caffe, DIGITS, R, MXNet, TensorFlow

    평가 유형: 코드 기반

    언어: 영어, 일본어

    인증 가능

    이 과정은 다양한 의료 작업 및 계산을 수행하기 위해 나선형 신경망(CNN)을 MRI 스캔에 적용하는 방법을 살펴봅니다. 학습 내용

    • 좌심실 위치 파악을 위해 MRI 이미지에서 이미지 세분화를 수행
    • 심장질환 감지를 위해 MRI 스캔에 적용된 CNN을 이용해 확장기 및 수축기 사이의 차이를 측정하여 박출률을 계산
    • 1p/19q 염색체 공동 삭제 상태를 파악하기 위해 LGG(저등급 교종)의 MRI 스캔에 CNN을 적용

    이 과정을 완료하면 다양한 의료 작업 수행을 위해 MRI 스캔에 CNN을 적용할 수 있게 됩니다.

  • 의료 유전체학을 위한 딥 러닝

    전제 조건: 심층 신경망에 대한 기본 지식, Python 또는 유사 언어의 기본 코딩 경험

    프레임워크: TensorFlow, Caffe, DIGITS, Theano, DragoNN

    평가 유형: 선다형 문제

    언어: 영어, 일본어

    인증 가능

    이 과정은 염색체 공동 삭제를 감지하고 유전체 서열에서 모티프를 찾기 위해 딥 러닝을 적용하는 방법을 교육합니다. 학습 내용

    • 나선형 신경망(CNN)의 기초와 그 작용 기전에 대한 이해
    • 1p/19q 염색체 공동 삭제 상태를 파악하기 위해 LGG(저등급 교종)의 MRI 스캔에 CNN을 적용
    • 유전체 데이터를 시뮬레이션하고 모티프를 찾기 위해 DragoNN 툴킷을 이용

    이 과정을 완료하면 CNN의 작용 기전을 이해하고 CNN을 이용한 MRI 이미지를 평가하고 새로운 모티프 연구를 위해 실제 유전체 조절 데이터를 이용할 수 있게 됩니다.

  • 지능형 비디오 분석(IVA)을 위한 딥 러닝

    선수 과목 : 딥 네트워크 (특히 CNN의 변형), C ++ 및 Python의 중급 수준

    프레임워크 : TensorFlow, TensorRT, Caffe

    평가 유형: 코드 기반

    언어: 영어

    인증 가능

    고화질, 고품질의 비디오 피드에 대한 대중의 기대가 높아, 이를 충족시키기에는 아직도 데이터가 많이 부족합니다. 매일 10 억 개 이상의 카메라가 전 세계의 거의 모든 순간들을 캡처하고 있습니다. 이러한 동영상 피드를 처리하려면 고급 기술이 필요하며 이를 실제 분석으로 변환해야 의미가 있습니다. 여기에는 식별, 분류, 세그멘테이션, 예측 및 권장이 포함됩니다. 해당 강의를 통해서는 아래 내용을 학습하실 수 있습니다 :

    • TensorFlow 객체 감지 API (Application Programming Interface)를 사용하여 딥 러닝 모델 학습 및 평가
    • 대규모 비디오 데이터 세트에서 움직이는 물체를 추적하기 위해 고품질의 뉴럴 네트워크 모델 개발과 관련된 전략과 절충 사항 학습
    • 실시간 애플리케이션을 위해 TensorRT를 사용하여 추론 시간 최적화

    학습을 완료하면, 개체 탐지 및 추적 네트워크를 배포하여 실시간으로 대규모 비디오 스트림에서 작업 할 수 있습니다.

  • 로보틱스를 위한 딥 러닝

    전제 조건: 심층 신경망에 대한 기본 지식, Python 또는 유사 언어의 기본 코딩 경험

    프레임워크: DIGITS

    평가 유형: 코드 기반

    언어: 영어

    인증서 제공

    AI는 광범위한 산업에서 로보틱스의 개발 및 가속화를 혁신합니다. Jetson에서 임베디드 분야를 위한 로보틱스 솔루션을 만드는 방법을 살펴보십시오. 다음과 같은 내용을 배울 수 있습니다.

    • 감지 수행을 위한 컴퓨터 비전 모델 적용
    • 임베디드 분야를 위한 모델 간소화 및 최적화
    • 시각적 입력을 토대로 올바른 출력을 구동하기 위한 로봇 트레이닝

    이 과정을 완료하면 로보틱스를 위해 고성능 딥 러닝을 배포하는 방법을 알게 됩니다.

Accelerated Computing Workshops

If your team is new to accelerated computing, they can start by learning how to accelerate applications with CUDA and OpenACC

  • CUDA C/C++를 사용한 가속 컴퓨팅의 기초 

    전제 조건: 변수 유형, 루프, 조건문, 함수 및 어레이 처리에 대한 지식을 포함하는 기본 C/C++ 능력 CUDA 프로그래밍 지식은 필요하지 않습니다.

    평가 유형: 코드 기반

    언어: 영어, 중국어, 일본어, 한국어

    인증서 제공

    CUDA 컴퓨팅 플랫폼은 세계에서 가장 빠른 초병렬 GPU에서 실행할 수 있도록 CPU 전용 애플리케이션의 가속화를 지원합니다. 다음에 의한 C/C++ 애플리케이션 가속화를 경험

    • GPU에서 잠재 병렬 처리를 실행하기 위해 CPU 전용 애플리케이션 가속화
    • 가속화된 애플리케이션을 최적화하기 위해 필수적인 CUDA 메모리 관리 기법 활용
    • 가속화된 애플리케이션의 동시 실행에 대한 잠재성을 노출하고 CUDA 스트림으로 이를 활용
    • 명령줄과 시각적 프로파일링을 활용해 작업을 안내 및 확인

    이 과정을 완료하면 가장 필수적인 CUDA 도구 및 기술을 이용해 기본 C/C++ CPU 전용 애플리케이션을 가속화 및 최적화할 수 있게 됩니다. 가속화된 애플리케이션을 빠르게 출시할 수 있는 CUDA 개발의 반복적 스타일을 이해할 수 있으실 것입니다.

  • CUDA Python 을 활용한 컴퓨팅 가속화 기초 강의

    선행 조건 : 변수 유형, 반복문, 조건문, 함수 및 배열 조작에 대한 지식을 포함한 기본 Python 역량, ndarrays 및 ufuncs 사용을 비롯한 NumPy 역량

    소요 시간: 8시간

    평가 유형: 코드 기반

    언어: 영어

    인증 가능

    이 워크샵에서는 파이썬 프로그램을 CPU 병렬가속화 하기 위해 Numba-Just-In-Time Python 함수 컴파일러-를 어떻게 사용할 수 있는지 배웁니다. 해당 강의를 통하여 아래 내용을 학습할 수 있습니다 :

    • Numba를 사용하여 NumPy 범용 함수 (ufuncs)에서 CUDA 커널 컴파일
    • Numba를 사용하여 CUDA 커널을 만들고 실행
    • 핵심 GPU 메모리 관리 기법 적용

    학습을 완료하면 Numba를 사용하여 CUDA 커널을 컴파일하고 실행하여 NVIDIA GPU에서 Python 응용 프로그램을 가속화 할 수 있습니다.

엔터프라이즈 솔루션

더욱 포괄적인 엔터프라이즈 교육을 찾고 계신다면 DLI 엔터프라이즈 솔루션이 귀 조직의 고유한 요구 사항을 충족하는 교육 및 강의 패키지를 제공합니다. 온라인 및 현장 핸즈온 세션부터 임원 보고 및 엔터프라이즈 수준의 보고까지, DLI는 고객사가 AI 조직으로 전환하는 과정을 도와드릴 수 있습니다. 자세히 알아보시려면 문의해 주십시오.

리소스

AI 기초 및 AI가 어떻게 비즈니스에 영향을 미칠 수 있는지에 대한 광범위한 리소스를 검토해 보십시오.

NVIDIA에서 강의 자료를 다운로드해서 대학의 커리큘럼을 강화하거나 캠퍼스에서 DLI 워크숍을 제공할 수 있는 인증을 획득하십시오.

교육용 키트

DLI 교육용 키트는 딥 러닝, 가속 컴퓨팅, 로보틱스 전반에 대한 강의 솔루션을 찾고 있는 적격한 대학 교육자에게 제공됩니다. 교육자는 강의 자료, 핸즈온 세션, GPU 클라우드 자원 등을 커리큘럼에 통합할 수 있습니다.

University Ambassador Program

DLI 대학교 앰버서더 프로그램은 선별된 교육자들이 핸즈온 DLI 워크샵을 대학생들과 연구원들에게 비용 없이 제공하는 인증 프로그램입닌다. 교육자들은 엠베서더 프로그램 참여를 위해 DLI 교육 키트 를 다운받게 됩니다.

DLI는 다음을 비롯한 수백 개의 대학에서 인증된 대학교 앰배서더를 갖추고 있습니다.

Arizona State University
Columbia
The Hong Kong University Of Science And Technology
Massachusetts Institute of Technology
NUS - National University of Singapore
University of Oxford