NVIDIA Mission Control™은 개발자 워크로드 스케줄링 및 오케스트레이션부터 모니터링 및 자율 복구에 이르기까지 AI 팩토리의 모든 측면을 간소화하는 동시에, 완벽하게 지원되는 소프트웨어를 통해 플랫폼 팀이 효율적으로 운영하고 자신 있게 확장할 수 있도록 지원합니다. 이 솔루션은 AI의 최신 최첨단 기술을 위해 NVIDIA Blackwell 및 NVIDIA Rubin 데이터 센터를 구동하며, 실시간 가시성과 성능, 전력, 냉각에 대한 정밀한 제어, 그리고 상시 가동형 탄력성을 결합하여 AI 팩토리 ROI를 극대화합니다. Mission Control은 모든 기업이 오늘날의 하이퍼스케일러의 효율성을 바탕으로 AI를 실행하여 AI 토큰 생산을 가속화하도록 지원합니다.
클러스터 수명 주기 전체에 걸쳐 AI 팩토리의 배포 및 운영 방식을 간소화합니다.
NVIDIA Mission Control 2.3은 NVIDIA 에코시스템 전반에 걸쳐 완전히 통합되어 있으며, NVIDIA GB200 NVL72 및 NVIDIA GB300 NVL72를 지원합니다. 서비스 전반에 걸친 새로운 통합 인증과 유연성과 확장성을 향상시키는 가상 제어 평면을 위한 추가 옵션을 갖추고 있습니다. 또한 Mission Control은 이제 에어갭 환경을 위한 배포를 제공하고 누수 감지 검증 검사를 제공합니다. NVIDIA Blackwell 아키텍처를 기반으로 하는 NVIDIA DGX™ 시스템은 이제 자율 복구 엔진 제품군을 포함한 전체 Mission Control 기능을 이용할 수 있습니다.
NVIDIA Mission Control은 클러스터, 시스템, 워크로드 수준에서 동작을 모니터링하고 관리하기 위한 사용이 간편한 그래픽 인터페이스를 갖춘 검증된 워크플로우에서 NVIDIA의 최신 전력 최적화 혁신에 대한 액세스를 포함합니다. 관리자는 Mission Control을 통해 도메인 전력 서비스에 액세스하고, 전력 최적화를 위한 작업 인식을 갖춘 클러스터 전반의 동적 정책을 설정할 수 있습니다.
원활한 멀티 노드 학습 및 추론 오케스트레이션, 타사 소프트웨어와의 통합 유연성, 고급 전력 및 냉각 자동화를 통해 AI 팩토리 운영에 민첩성을 도입하세요.
즉시 사용할 수 있는 통합 Grafana 대시보드와 상시 상태 점검을 통해 워크로드 가동 시간, 클러스터 인프라 및 시설에 대한 심층적인 가시성을 확보하여 경고 피로를 줄이고 성능을 최적화하세요.
이상 감지부터 격리, 빠른 작업 재시작, 자동화된 하드웨어 복구에 이르기까지 포괄하는 엔드 투 엔드 자율 복구 엔진을 통해 최신 데이터 센터의 탄력성을 재정의하세요.
엔드 투 엔드 검증된 워크플로우, 수익 잠재력 향상을 위한 지속적인 운영, 그리고 대규모 엔터프라이즈 AI의 새로운 표준을 위한 NVIDIA 엔터프라이즈 지원을 통해 AI 팩토리의 성과를 극대화하세요.
파트너
주요 시스템 제공업체에서 검증을 마친 NVIDIA Mission Control을 활용해, NVIDIA Grace™ Blackwell NVL72 기반 AI 팩토리를 구성하고 검증 및 운영해 보세요.
NVIDIA는 AI 팩토리를 위한 모든 구성 요소를 제공합니다. NVIDIA Mission Control과 NVIDIA AI 엔터프라이즈는 함께 최첨단 인프라와 워크로드 및 생산 AI를 위한 개발자 도구를 제공하여, 기업이 전례 없는 실용적인 규모로 AI의 혁신적인 힘을 활용할 수 있도록 지원합니다.