NVIDIA Nemotron

업계 최고 수준의 개방형 추론 및 멀티모달 파운데이션 모델로 강력한 엔터프라이즈 AI 에이전트를 구축하세요.

개요

NVIDIA Nemotron이란 무엇인가요?

NVIDIA Nemotron™은 효율적이고 정확하며 특화된 에이전틱 AI 시스템을 구축할 수 있도록 지원하는 개방형 모델, 데이터세트, 기술 제품군입니다. 고급 추론, 코딩, 비주얼 이해, 에이전트 작업, 안전성, 정보 검색을 위해 설계된 Nemotron 모델은 오픈 형태로 제공되며 AI 에코시스템 전반에 통합되어 있어, 엣지부터 클라우드까지 어디서나 배포할 수 있습니다.

투명한 학습 데이터와 NVIDIA RTX PRO 및 NVIDIA DGX Spark™를 포함한 광범위한 플랫폼 지원을 통해, Nemotron은 신뢰할 수 있는 고성능 AI 에이전트를 더욱 쉽게 제작하고 배포할 수 있는 환경을 제공합니다.

NVIDIA, AI 성능 강화를 위해 오픈 모델 생태계 확장

에이전트, 머신, 의료 및 자율주행차 개발을 위해 구축된 새로운 오픈 모델 제품군을 소개합니다.

새로운 Nemotron 모델을 활용한 음성 인식 RAG 에이전트 구축 방법

음성, RAG, 안전성 및 긴 컨텍스트 추론을 위한 Nemotron 모델을 통합하여 실시간 음성 기반 RAG 에이전트를 구축하는 방법에 대한 단계별 가이드를 확인해 보세요.

동영상

NVIDIA가 Nemotron을 구축한 이유

NVIDIA의 Applied Deep Learning Research 부문 부사장 Bryan Catanzaro가 전하는 Nemotron의 비전과 함께, 신뢰할 수 있는 기업용 AI 구축을 위한 오픈 기술의 필수성을 확인해 보세요.

이점

Nemotron은 에이전틱 AI에 어떤 이점을 제공하나요?

높은 정확도

Nemotron 모델은 탁월한 지식을 기반으로 널리 사용되는 개방형 추론 모델을 구축하고, 고품질의 훈련 데이터로 사후 훈련하며, 인간과 같은 추론에 맞게 조정되어 주요 벤치마크에서 최고의 정확도를 제공합니다.

높은 연산 효율성

대형 모델을 효율적으로 경량화한 Nemotron 제품군은 NVIDIA TensorRT™-LLM을 활용해 높은 처리량과 뛰어난 연산 효율, 필요 시 작동하는 유연한 추론 기능(on-or-off reasoning)을 제공합니다.

상업적 실용성

NVIDIA의 보완 학습 데이터 및 최적화 기법은 개발자와 기업 모두에게 강력하고 투명하며 적응력이 뛰어난 모델을 보장합니다. 모델과 학습 데이터는 Hugging Face에 공개되어 있습니다.

안전하고 간단한 배포

최적화된 NVIDIA NIM™ 마이크로서비스로 제공되는 Nemotron 모델 제품군은 최고 수준의 추론 성능과 유연한 배포 옵션을 갖추고 있으며, 보안, 프라이버시, 이식성 측면에서도 뛰어난 경험을 제공합니다.

모델

다양한 워크로드를 위한 모델

Nemotron 모델은 추론, 비전, 검색 증강 생성(RAG), 음성, 안전성을 다양한 에이전틱 AI 작업에서 탁월한 성능을 발휘합니다. 실험을 위한 연구용 모델도 제공됩니다.

추론

다양한 Nemotron 추론 모델 중에서 선택할 수 있습니다. Nano는 PC와 엣지 디바이스에서 뛰어난 정확도를 제공하고, Super는 단일 NVIDIA Tensor Core GPU에서 구동 시 가장 높은 정확도와 처리량을 보여줍니다. Ultra는 멀티 GPU 데이터 센터에 최적화되어 복잡한 시스템에서 최상의 정확도를 구현합니다.

시각적 이해

Nemotron 모델은 강력한 문서 인텔리전스, 시각적 질의응답 및 요약 기능을 바탕으로 멀티 이미지 추론과 비디오 이해 분야에서 업계 최고 수준의 정확도를 제공합니다.

NVIDIA Nemotron Parse를 사용하여 문서 데이터를 추출한 뒤, NVIDIA Nemotron 2 Nano VL을 활용해 텍스트 콘텐츠를 차트, 다이어그램 및 기타 시각 자료와 연계하여 지능형 쿼리를 수행할 수 있습니다.

음성

NVIDIA Nemotron 음성 모델은 에이전틱 AI 애플리케이션을 위해 고처리량과 초저지연 시간을 보장하는 자동 음성 인식(ASR), 텍스트 음성 변환(TTS) 및 신경망 기계 번역(NMT) 기능을 제공합니다.

검색 증강 생성(RAG)

Nemotron RAG 모델은 멀티모달 구조화 정보를 추출하고, 고품질 임베딩을 생성하며, 가장 관련성이 높은 문서를 순위별로 정렬하여 빠르고 정확한 문서 이해 능력을 제공합니다. LLM 학습을 위한 데이터 품질을 향상시키고, 에이전트 및 검색 성능을 강화하며, 문서 워크플로우를 간소화하는 확장 가능한 고속 검색 기능을 제공합니다.

안전

NVIDIA Nemotron Safety 모델은 유해 콘텐츠, 주제 이탈, 정책 우회(jailbreak) 시도를 실시간으로 감지하고 차단합니다. 추론 기능을 갖춘 다국어 멀티모달 콘텐츠 안전 계층을 추가하여 모니터링 역량을 강화하고, 각 지역의 문화적 가치에 부합하도록 보장합니다.

기술

에이전틱 AI를 위한 필수 구성 요소

맞춤형 에이전틱 AI를 위한 NVIDIA NeMo™, 빠른 엔터프라이즈급 배포를 위한 NVIDIA NIM, NVIDIA Blueprints를 사용하여 맞춤형 레퍼런스 워크플로우로 개발을 가속화하세요.

NVIDIA NeMo

  • 생성형 AI와 에이전틱 AI를 개발하고, 맞춤화하여 배포하세요.
  • 정밀한 데이터 큐레이션, 최첨단 사용자 정의, 확장 가능한 데이터 수집, RAG, 가속화된 성능을 통해 엔터프라이즈용 거대 언어 모델(LLM)을 제공하세요.
  • 데이터 플라이휠을 손쉽게 구축하고, 최신 정보로 AI 에이전트를 지속적으로 최적화하세요.

NVIDIA NIM

  • 성능 최적화 생성형 AI 모델의 배포 속도를 높여 보세요.
  • 엔터프라이즈급 지원이 뒷받침하는 안정적이고 안전한 API로 비즈니스 애플리케이션을 실행하세요.

NVIDIA Blueprint

  • 엔터프라이즈 심층 리서치나 멀티모달 RAG 같은 생성형 AI 활용 사례를 위한 레퍼런스 애플리케이션으로 빠르게 시작해 보세요.
  • 파트너 마이크로서비스, 하나 이상의 AI 에이전트, 레퍼런스 코드, 커스터마이징 문서, 배포용 Helm 차트까지 포함한 blueprint를 활용해 개발을 더욱 가속하세요.

시작 옵션

Nemotron 시작 방법

무료로 프로토타이핑 시작하기

NVIDIA DGX™ Cloud기반의 간편한 NIM API 엔드포인트를 활용해 바로 시작해 보세요.

  • 완전히 가속화된 AI 인프라에 엑세스하세요.
  • 자신의 데이터가 모델 학습에 사용되지 않도록 하세요.
  • 별도의 크레딧 없이 구축, 테스트 및 배포를 위한 간결한 경로를 제공합니다.

문의하기

NVIDIA AI Enterprise와 함께 제공되는 보안, API 안정성, 지원으로 생성형 AI 파일럿을 프로덕션 환경으로 전환하는 방법에 대해 NVIDIA AI 전문가와 상담하세요.

  • 생성형 AI 사용 사례를 살펴보세요.
  • 기술적 요구 사항을 논의하세요.
  • NVIDIA AI 솔루션을 목표와 요구 사항에 맞게 조정하세요.

채택 업체

Nemotron을 사용하는 기업

리소스

Nemotron 최신 정보 살펴보기

NVIDIA가 Nemotron을 구축한 이유

Nemotron이 어떻게 혁신을 가속화하고, 개발자의 역량을 강화하며, AI의 미래를 만들어가고 있는지 알아보세요.

ServiceNow가 문서 인텔리전스를 발전시키는 비결

Nemotron의 모델 가중치, 데이터셋, 학습 레시피에 대한 접근이 어떻게 더 심도 있는 평가를 가능하게 했는지, 시각적 Q&A 정확도에 관해 ServiceNow가 발견한 사실은 무엇인지, 그리고 멀티모달 AI의 지속적인 개선을 위해 개방성이 왜 중요한지 알아보세요.

추론 ON/OFF: AI 추론으로 결혼식 자리 배치하기

AI 추론 기능을 갖춘 LLM이 복잡한 가족 관계와 하객들의 선호도를 고려하여, 결혼식 좌석 배치 문제를 해결하기 위해 어떻게 틀을 깨는 사고로 창의적인 솔루션을 찾아내는지 확인해 보세요.

블로그

FAQ

NVIDIA Nemotron 모델은 단순히 오픈 소스 수준이 아니라 진정한 오픈 소스입니다. NVIDIA는 학습 데이터셋, 기법, 모델 가중치를 게시하여 오픈 소스 커뮤니티가 우리의 학습 내용을 활용하고 이러한 리소스를 사용하여 자체 모델을 생성할 수 있도록 지원합니다.

NVIDIA 오픈 모델 라이선스는 사용자가 NVIDIA에 대한 별도의 크레딧 없이 생성형 AI의 혁신과 발전을 장려하며, 모델과 파생 모델을 사용, 수정, 배포, 상업적으로 활용할 수 있도록 하는 허용적인 라이선스입니다.

예, Hugging Face에서 NVIDIA Nemotron 모델을 무료로 다운로드하여 프로덕션에서 실행할 수 있습니다.

NVIDIA는 또한 NVIDIA AI 엔터프라이즈 라이선스가 필요하며, 안전하고 확장 가능한 배포를 위한 Nemotron 모델을 NVIDIA NIM 마이크로서비스로 제공합니다. Nemotron 모델을 사용해 보고 build.nvidia.com에서 NIM 마이크로서비스를 다운로드할 수 있습니다.

예, NVIDIA는 오픈 소스 에코시스템을 지원하기 위해 더 많은 Nemotron 모델, 데이터셋, 그리고 기법을 출시하기 위해 최선을 다하고 있습니다.

NVIDIA Nemotron 모델은 최첨단 개방형 모델을 기반으로 구축되어 더 나은 모델을 더 빠르게 구축할 수 있습니다. 또한, NVIDIA는 모델 가중치, 학습 데이터셋, 학습 기법을 게시하여 개발자 커뮤니티가 Nemotron의 다양한 부분을 사용하여 자체 모델을 학습시킬 수 있도록 지원합니다.

네, NVIDIA는 Llama 모델 제품군을 기반으로 Llama Nemotron 모델을 개발했으며, NVIDIA의 오픈 데이터셋과 뉴럴 아키텍처 탐색(NAS)과 같은 고급 기술을 사용했습니다. Llama Nemotron 모델은 상위 Llama 모델의 라이선스를 그대로 따릅니다.

NVIDIA는 프로덕션에서 NVIDIA Dynamo, TensorRT-LLM, NIM과 같은 다양한 도구를 제공하여 Nemotron 모델을 대규모로 실행할 수 있습니다. SGLang 및 vLLM과 같은 인기 있는 오픈 소스 라이브러리를 사용할 수도 있습니다.

다음 단계

시작할 준비가 되었나?

적절한 도구와 기술을 사용하여 NVIDIA Nemotron 모델을 개발에서 프로덕션으로 전환해 보세요.

문의하기

NVIDIA AI Enterprise와 함께 제공되는 보안, API 안정성, 지원을 통해 파일럿에서 프로덕션으로 전환하는 방법에 대해 NVIDIA 제품 전문가와 상담해 보세요.

최신 NVIDIA 에이전틱 AI 뉴스 받아보기

최신 에이전틱 AI 뉴스, 기술, 혁신 등의 소식을 이메일로 바로 받아보세요.