NVIDIA Mission Control

모델을 실행하고 필수적인 작업을 자동화하세요.

개요

세계에서 가장 앞선 AI 팩토리의 전문성을 모든 비즈니스에 제공합니다

NVIDIA Mission Control™은 개발자 워크로드 스케줄링 및 오케스트레이션부터 모니터링 및 자율 복구에 이르기까지 AI 팩토리의 모든 측면을 간소화하는 동시에, 완벽하게 지원되는 소프트웨어를 통해 플랫폼 팀이 효율적으로 운영하고 자신 있게 확장할 수 있도록 지원합니다. 이 솔루션은 AI의 최신 최첨단 기술을 위해 NVIDIA BlackwellNVIDIA Rubin 데이터 센터를 구동하며, 실시간 가시성과 성능, 전력, 냉각에 대한 정밀한 제어, 그리고 상시 가동형 탄력성을 결합하여 AI 팩토리 ROI를 극대화합니다. Mission Control은 모든 기업이 오늘날의 하이퍼스케일러의 효율성을 바탕으로 AI를 실행하여 AI 토큰 생산을 가속화하도록 지원합니다.

AI 팩토리 관리 및 운영

NVIDIA Mission Control은 클러스터 배포부터 워크로드 오케스트레이션, 시설 관리 통합에 이르기까지 AI 운영을 간소화하며, 모든 측면에서 기업이 필요로 하는 민첩성, 복원력, 하이퍼스케일 효율성을 제공합니다.

랙 스케일 하드웨어에서 스케줄링 가능한 AI 인프라까지

AI 아키텍트와 HPC 플랫폼 운영자의 경우 하드웨어를 랙에 설치하는 것만이 아니라 랙을 최종 사용자가 안전하고 성능이 뛰어나며 사용하기 쉬운 리소스 세트로 전환하는 것이 문제입니다. NVIDIA Mission Control과 같은 검증된 소프트웨어 스택은 멀티 노드 스케줄링을 위한 도구를 제공하며, Slurm과 쿠버네티스를 모두 지원합니다.

기술

AI 데이터센터 운영 및 오케스트레이션

클러스터 수명 주기 전체에 걸쳐 AI 팩토리의 배포 및 운영 방식을 간소화합니다.

고급 전력 최적화

검증된 NVIDIA 최신 전력 혁신 구현을 활용하여 전력이 제한되거나 비용을 중시하는 환경에서 85%의 전력으로 93%의 성능 처리량을 구현해 보세요.

시설 관리 통합

자동화 및 통합 대시보드를 통해 지원되는 향상된 시스템 및 데이터 센터 시설 조정을 통해 신속한 누설 감지를 포함한 전력 및 냉각 이벤트에 대한 제어 기능을 개선하세요.

자율 복구 엔진

수동 개입 없이 문제를 10배 더 빠르게 식별, 격리, 복구하여 개발자 생산성을 극대화하고 내장된 인프라의 회복력을 위한 학습 및 추론 실행 속도를 높입니다.

지속적인 상태 점검

NVIDIA의 사전 설정 규칙에 따라 자동화된 동작을 트리거하는 옵션과 상태 점검 기능을 활용하여 인프라의 라이프사이클 전반에 걸쳐 하드웨어 및 클러스터 성능을 검증하세요.

동적 워크로드 오케스트레이션

NVIDIA Run:ai 기술로 GPU 가용성과 활용도를 높이거나, Slurm 및 자체 Kubernetes를 클러스터 관리 플랫폼과 통합하세요.

유연하고 안전한 구성

NVIDIA Mission Control 서비스와 신뢰할 수 있는 ISV 솔루션을 통합하여 검증된 네임스페이스 격리를 제공하고 조직의 요구 사항을 충족하는 유연하고 안전한 구성을 구현하세요.

신규 릴리스

NVIDIA Mission Control 2.3

NVIDIA Mission Control 2.3은 NVIDIA 에코시스템 전반에 걸쳐 완전히 통합되어 있으며, NVIDIA GB200 NVL72NVIDIA GB300 NVL72를 지원합니다. 서비스 전반에 걸친 새로운 통합 인증과 유연성과 확장성을 향상시키는 가상 제어 평면을 위한 추가 옵션을 갖추고 있습니다. 또한 Mission Control은 이제 에어갭 환경을 위한 배포를 제공하고 누수 감지 검증 검사를 제공합니다. NVIDIA Blackwell 아키텍처를 기반으로 하는 NVIDIA DGX™ 시스템은 이제 자율 복구 엔진 제품군을 포함한 전체 Mission Control 기능을 이용할 수 있습니다.

NVIDIA Mission Control은 클러스터, 시스템, 워크로드 수준에서 동작을 모니터링하고 관리하기 위한 사용이 간편한 그래픽 인터페이스를 갖춘 검증된 워크플로우에서 NVIDIA의 최신 전력 최적화 혁신에 대한 액세스를 포함합니다. 관리자는 Mission Control을 통해 도메인 전력 서비스에 액세스하고, 전력 최적화를 위한 작업 인식을 갖춘 클러스터 전반의 동적 정책을 설정할 수 있습니다.

이점

NVIDIA Mission Control을 사용하는 이유

즉각적인 운영 민첩성

원활한 멀티 노드 학습 및 추론 오케스트레이션, 타사 소프트웨어와의 통합 유연성, 고급 전력 및 냉각 자동화를 통해 AI 팩토리 운영에 민첩성을 도입하세요.

광범위한 모니터링

즉시 사용할 수 있는 통합 Grafana 대시보드와 상시 상태 점검을 통해 워크로드 가동 시간, 클러스터 인프라 및 시설에 대한 심층적인 가시성을 확보하여 경고 피로를 줄이고 성능을 최적화하세요.

내장된 탄력성

이상 감지부터 격리, 빠른 작업 재시작, 자동화된 하드웨어 복구에 이르기까지 포괄하는 엔드 투 엔드 자율 복구 엔진을 통해 최신 데이터 센터의 탄력성을 재정의하세요.

가속화된 AI 토큰 생성

엔드 투 엔드 검증된 워크플로우, 수익 잠재력 향상을 위한 지속적인 운영, 그리고 대규모 엔터프라이즈 AI의 새로운 표준을 위한 NVIDIA 엔터프라이즈 지원을 통해 AI 팩토리의 성과를 극대화하세요.

파트너

선도적인 시스템 제공업체와 함께 AI 팩토리 배포 및 운영

주요 시스템 제공업체에서 검증을 마친 NVIDIA Mission Control을 활용해, NVIDIA Grace™ Blackwell NVL72 기반 AI 팩토리를 구성하고 검증 및 운영해 보세요.

솔루션

세계 최고 수준의 AI 팩토리를 위해 필요한 모든 것

NVIDIA는 AI 팩토리를 위한 모든 구성 요소를 제공합니다. NVIDIA Mission Control과 NVIDIA AI 엔터프라이즈는 함께 최첨단 인프라와 워크로드 및 생산 AI를 위한 개발자 도구를 제공하여, 기업이 전례 없는 실용적인 규모로 AI의 혁신적인 힘을 활용할 수 있도록 지원합니다.

NVIDIA DGX SuperPOD

고유한 AI 수요에 맞게 특별히 설계된 리더십급의 AI 인프라.

NVIDIA DGX SuperPOD™는 모든 사용자와 워크로드에 탁월한 성능을 제공하는 턴키 AI 데이터센터 인프라 솔루션입니다. 모든 NVIDIA DGX 시스템과 함께 구성할 수 있는 DGX SuperPOD는 가장 까다로운 AI 학습 및 추론 워크로드를 위한 확장 가능한 성능을 갖춘 리더십 수준의 가속 인프라를 제공합니다.

NVIDIA AI Enterprise

프로덕션 AI를 최적화하는 클라우드 네이티브 소프트웨어 플랫폼으로, 개발자용으로 제작된 도구를 갖추고 있습니다.

NVIDIA AI Enterprise 소프트웨어 제품군에는 NVIDIA의 선도적인 데이터 사이언스 도구, 사전 훈련된 모델, 최적화된 프레임워크 등이 포함되어 있으며, NVIDIA 엔터프라이즈 지원으로 완벽하게 뒷받침됩니다. NVIDIA AI Enterprise는 Mission Control에서 실행되도록 최적화되었습니다.

다음 단계

시작할 준비가 되셨나요?

NVIDIA Mission Control로 AI 운영을 간소화하고, 기업의 대규모 AI 프로젝트를 효과적으로 추진하세요.

NVIDIA Mission Control과 관련하여 지원이 필요하신가요?

NVIDIA DGX Enterprise 지원 및 서비스를 통해 전문가 지원과 더 빠른 문제 해결 및 안내를 받아보세요.

NVIDIA Mission Control 문서

NVIDIA Mission Control의 사용자 가이드와 릴리스 노트를 확인해 보세요.