NVIDIA 엔터프라이즈 레퍼런스 아키텍처.

엔터프라이즈 레퍼런스 아키텍처

확장 가능한 AI 팩토리 구축하기

NVIDIA 엔터프라이즈 레퍼런스 아키텍처로 데이터센터를 고성능 AI 팩토리로 전환하세요.

개요

AI 성공을 위한 핵심 구성 요소

NNVIDIA 엔터프라이즈 레퍼런스 아키텍처는 조직이 검증되고 반복 가능한 인프라를 사용하여 고성능 AI 팩토리를 설계, 배포, 확장할 수 있도록 지원합니다. 이러한 설계는 인증된 컴퓨팅, 고속 동서 및 남북 네트워킹, 관측 도구 및 소프트웨어를 결합하여 4노드 클러스터부터 엔터프라이즈 규모의 환경에 이르기까지 확장 가능한 성능을 보장합니다.

Palantir, NVIDIA와 협력하여 소버린 AI 운영 체제 레퍼런스 아키텍처 제공

Palantir 소버린 AI OS 레퍼런스 아키텍처는 NVIDIA 엔터프라이즈 레퍼런스 아키텍처(RA)를 기반으로 하며, NVIDIA AI 인프라에서 Palantir의 전체 소프트웨어 제품군을 실행할 수 있도록 테스트와 인증을 완료했습니다.

검증된 설계 및 검증된 성능

실제 배포와 실전에서 검증된 구성을 기반으로 구축된 엔터프라이즈 레퍼런스 아키텍처(RA)가 어떻게 확장 가능한 AI 인프라를 위해 계획을 간소화하고 ROI를 극대화하는지 알아보세요.

엔터프라이즈 레퍼런스 아키텍처

전체 제품군 가이드

데이터 센터에서 클러스터를 구축하기 위한 종합적인 설정 가이드를 지금 확인하실 수 있습니다.

인프라

NVIDIA 엔터프라이즈 레퍼런스 아키텍처는 CPU-GPU 네트워킹 노드 패턴, 케이블 연결 다이어그램, 인프라 세부 정보를 포함한 검증된 하드웨어 구성으로 시작합니다.

네트워크 로직

엔터프라이즈 RA를 위한 네트워킹 구성 및 논리 아키텍처 로직 가이드에는 NVIDIA Air에서 VLAN 설계 및 네트워크 시뮬레이션을 통해 노드 관리 및 프로비저닝 가이드가 제공됩니다.

소프트웨어

엔터프라이즈 레퍼런스 아키텍처를 위한 소프트웨어 레퍼런스 스택은 인프라 클러스터의 관리, 프로비저닝(배포), 및 사이징(규모 산정)에 사용되는 소프트웨어 구성을 설명합니다. 현재 버전은 오픈소스 Kubernetes를 중심으로, NVIDIA AI Enterprise와 NVIDIA Run:ai 소프트웨어에 초점을 맞추고 있습니다.

가시성

NVIDIA 엔터프라이즈 레퍼런스 아키텍처를 위한 관측 가능성 가이드는 Prometheus 및 Grafana와 같은 오픈 소스 도구를 활용하여 전체 클러스터 전반의 GPU 및 네트워킹 성능을 모니터링합니다. 대시보드는 시스템 상태 및 워크로드 효율성에 대한 실시간 지표를 제공합니다.

배포

NVIDIA 엔터프라이즈 레퍼런스 아키텍처를 위한 배포 가이드는 우리 팀이 프로그램을 구축한 자체 클러스터를 시작, 배포, 테스트, 검증하여 배운 인프라 모범 사례 모음입니다.

스토리지

NVIDIA 인증 스토리지 프로그램은 엔터프라이즈 RA와의 통합을 위해 전용 스토리지 가이드를 제작한 주요 파트너사들이 함께 참여하는 협력 프로그램입니다. 이 독특한 프로그램에 대해 자세히 알아보세요.

사용 사례

모든 사용 사례를 위한 설계

글로벌 파트너의 검증된 NVIDIA 엔터프라이즈 레퍼런스 아키텍처와 NVIDIA 인증 시스템을 통해 에이전틱 AI, 피지컬 AI, 고성능 컴퓨팅(HPC) 및 AI 시뮬레이션 워크로드를 가속화하세요. 엔터프라이즈 AI 팩토리 배포를 위한 주 인프라 클러스터 구성의 개요는 아래와 같습니다.

NVIDIA RTX PRO AI 팩토리

NVIDIA RTX PRO™ AI 팩토리 구성은 생성형 및 에이전틱 AI, 데이터 분석, 비주얼 컴퓨팅 및 엔지니어링 시뮬레이션을 포함한 광범위한 엔터프라이즈 워크로드를 위해 설계되었습니다. 배포는 16노드 및 32노드 설계 기준을 중심으로 최적화되어 성능, 확장성 및 배포 효율성 간의 이상적인 균형을 제공합니다. 엔터프라이즈 AI, 시뮬레이션 및 비주얼 컴퓨팅 전반에 걸쳐 범용 워크로드 가속화를 위해 설계된 NVIDIA RTX PRO 서버는 PCIe 환경에 최적화되어 공간, 전력 및 냉각 제약이 있는 데이터 센터에 이상적입니다. 최신 AI 워크로드를 위해 특별히 구축된 이 제품은 에이전틱 AI 및 대규모 언어 모델(LLM) 추론을 위한 효율적인 성능을 제공합니다.

NVIDIA HGX AI 팩토리

고성능 NVIDIA HGX™ AI 팩토리 구성은 NVIDIA HGX 시스템을 활용하여 멀티 노드 AI 학습 및 대규모 추론을 위해 특별히 구축되었습니다. 32, 64 및 128노드 설계 지점에서 제공되며 NVIDIA Spectrum-X™ 네트워킹이 지원되는 이 아키텍처는 유연한 레일 최적화 설계를 특징으로 하며, 다양한 랙 레이아웃 전반에서 효율적인 통합을 가능하게 하는 동시에 고처리량과 저지연 성능을 제공합니다. 가장 까다로운 워크로드를 실행하는 AI 파워 사용자에게 획기적인 성능을 제공하고, 대규모 모델 학습 및 미세 조정을 지원하며, 추론을 획기적으로 가속화합니다. 차세대 정밀도와 초고속 상호 연결을 통해 이 솔루션은 최대 15배 더 높은 토큰 처리량을 달성합니다.

NVIDIA NVL72 AI 팩토리

NVIDIA NVL72 AI 팩토리 구성은 1조 개의 매개변수 모델을 학습하고 배포하도록 설계되어 단일 랙 내에서 엑사스케일 컴퓨팅 파워를 제공합니다. 대규모 모델 처리량, 멀티 사용자 추론 및 대규모 실시간 추론을 위해 구축된 이 제품은 차세대 AI 기반 혁신을 지원합니다. 배포 설계 포인트는 4랙 및 8랙 구성을 중심으로 중점을 둡니다. 유연한 레일 최적화 네트워크를 기반으로 구축된 이 아키텍처는 다양한 랙 레이아웃 및 시스템 설계에 유연하게 대응하는 동시에 고대역폭 및 저지연 성능을 제공합니다. 이 플랫폼은 업계 최고의 에너지 효율과 함께 탁월한 AI 팩토리 성능을 제공하며, 5세대 NVIDIA NVLink™, FP4 Tensor 코어 및 첨단 열 관리 기술을 기반으로 합니다.

이점

엔터프라이즈 RA의 전략적 가치

검증된 파트너 준비 구성으로 확장 가능한 고성능 AI 인프라를 활용해 보세요.

AI 워크로드를 위한 최고 성능

멀티 노드 클러스터 전반에서 전체 GPU 활용도와 성능 일관성을 보장하는 아키텍처를 통해 AI 추론, 미세 조정 및 학습의 집약적인 요구 사항을 충족하세요.

유연한 확장, 운영 간소화

인프라를 쉽게 확장하고 최대 128노드까지 확장 가능하고 간소화된 배포를 보장합니다. 소프트웨어 에코시스템을 활용하는 NVIDIA 엔터프라이즈 AI 팩토리 검증 설계를 통해 풀스택 솔루션을 위한 기반을 구축하세요.

복잡성 및 TCO 감소

배포 프로세스와 효율적인 설계를 간소화하고, 복잡성과 총 소유 비용(TCO)을 줄이는 동시에, 가치 창출 시간을 단축하세요.

지원 용이성

특정 표준화된 설계 패턴을 따라 설치 간 일관된 운영을 달성하고, 반복적인 지원의 필요성을 줄이는 동시에 더 빠른 문제 해결 시간을 지원합니다.

파트너

성능을 위한 협업

저희는 주요 파트너들과 협력하여 그들이 엔터프라이즈 레퍼런스 아키텍처와 AI 팩토리 솔루션을 시장에 선보이는 것을 자랑스럽게 생각합니다. 이러한 파트너들의 승인된 설계는 NVIDIA의 설계 검토 위원회(Design Review Board)의 심사를 통과하였으며, 인프라, 네트워킹 로직, 소프트웨어 등 하나 이상의 분야에서 NVIDIA의 인증을 받을 수 있는 가이드를 제공합니다.

NVIDIA를 활용한 Palantir 소버린 AI OS 레퍼런스 아키텍처

Palantir 소버린 AI OS 레퍼런스 아키텍처는 NVIDIA 엔터프라이즈 레퍼런스 아키텍처(RA)를 기반으로 하며, 글로벌 시스템 파트너와 협력하여 NVIDIA AI 인프라에서 Palantir의 전체 소프트웨어 제품군을 실행할 수 있도록 테스트와 인증을 완료했습니다. 이 소버린 AI 아키텍처는 지연에 민감한 워크플로우, 데이터 주권 요구 사항 및 광범위한 지리적 분산 환경을 가진 고객에게 핵심적입니다. 이 아키텍처는 기업이 데이터, AI 모델 및 애플리케이션에 대한 완전한 제어권을 가질 수 있도록 지원합니다.

리소스

엔터프라이즈 레퍼런스 아키텍처에 대해 자세히 알아보기

NVIDIA RTX PRO AI 팩토리 레퍼런스 아키텍처

NVIDIA RTX PRO AI 팩토리 구성은 에이전틱 AI 추론, 피지컬 및 산업용 AI, 비주얼 컴퓨팅, 데이터 분석 및 시뮬레이션을 위한 고성능 컴퓨팅(HPC)을 포함한 광범위한 엔터프라이즈 워크로드를 지원합니다. 이 문서는 확장 가능한 모듈형 아키텍처를 뒷받침하는 하드웨어 구성 요소에 대해 자세히 설명합니다.

NVIDIA HGX AI 팩토리 레퍼런스 아키텍처

NVIDIA HGX AI 팩토리 구성은 고성능 AI 추론, 모델 학습 및 미세 조정에 중점을 둡니다. 이 문서는 클러스터를 상호 연결에 사용되는 클러스터 지침 및 네트워크 패브릭 토폴로지를 포함하여, 확장 가능한 모듈형 아키텍처의 하드웨어 구성 요소에 대한 개요를 설명합니다.

NVIDIA Run:ai를 활용한 대규모 토큰 처리량 실현

Nebius와의 공동 벤치마킹에 따르면, NVIDIA 엔터프라이즈 레퍼런스 아키텍처에서 NVIDIA Run:ai를 사용하는 분할 GPU 배포가 프로덕션 LLM 워크로드의 처리량과 활용도를 크게 향상시키는 것으로 나타났습니다.

NVIDIA 엔터프라이즈 레퍼런스 아키텍처 개요

이 백서는 32개서 1,024개 GPU 규모의 엔터프라이즈급 배포를 위한 AI 팩토리 설계 및 구축에 검증된 지침을 제공하는 NVIDIA 엔터프라이즈 레퍼런스 아키텍처를 소개합니다. 이러한 아키텍처는 AI 인프라 배포를 간소화하고 운영 복잡성을 줄이며, 가치 실현 시간을 단축하는 데 도움이 됩니다.

남북향 네트워크: 엔터프라이즈 AI 워크로드 가속화의 핵심

NVIDIA 엔터프라이즈 레퍼런스 아키텍처는 남북 및 동서 네트워크를 활용하는 AI 팩토리 구축 시 조직을 가이드하며, 확장 가능하고 안전한 고성능 AI 인프라를 위한 설계 레시피를 제공합니다.

새로운 엔터프라이즈 레퍼런스 아키텍처를 활용한 NVIDIA H200 NVL 대규모 배포

NVIDIA H200 NVL은 향상된 메모리, 고속 NVLink 및 최적화된 엔터프라이즈 RA 구성을 통해 AI 배포를 가속화합니다.

NVIDIA의 AI 팩토리, 대규모 엔터프라이즈 혁신 주도

NVIDIA는 엔터프라이즈 전반에서 생성형 AI 및 에이전틱 워크플로우를 확장하여 보안, 성능, 일관성을 보장하는 통합 AI 팩토리를 구축했습니다. 이 플랫폼은 혁신을 가속화하고 소프트웨어 및 하드웨어 엔지니어링을 간소화하며 공급망 운영을 최적화하는 수백 개의 AI 에이전트를 지원하여 계획 시간을 95% 이상 단축하고 수십 년에 걸쳐 진행된 엔지니어링 작업을 단 1년 만에 달성합니다.

다음 단계

시작할 준비가 되셨나요?

NVIDIA 엔터프라이즈 AI 팩토리에 대해 자세히 알아보세요.

NVIDIA 엔터프라이즈 레퍼런스 아키텍처에 대해 자세히 알아보기

NVIDIA 엔터프라이즈 레퍼런스 아키텍처가 고성능 AI 인프라 배포를 위한 확장 가능하고 규정적인 청사진을 제공하는 방법을 살펴보세요.

클러스터 구성 2-8-5-200 사양

클러스터 구성 2-8-9-400 사양

클러스터 구성 2-4-6-400 사양

Cisco는 AI 시대에 조직이 연결하고 보호하는 방식을 혁신하고 있는 세계적인 기술 리더입니다. 40년 이상 Cisco는 전 세계를 안전하게 연결해 왔습니다. 업계 선도적인 AI 기반 솔루션 및 서비스를 통해 Cisco는 고객, 파트너 및 지역 사회가 혁신을 실현하고 생산성을 향상시키며 디지털 회복탄력성을 강화할 수 있도록 지원합니다. 목적 중심의 경영을 핵심 가치로 삼아, Cisco는 모두를 위해 더 연결되고 포용적인 미래를 만드는 데 전념하고 있습니다.

NVIDIA 설계 리뷰 보드가 승인한 솔루션:

Dell Technologies는 조직과 개인이 디지털 미래를 구축하고 업무, 생활, 놀이 방식을 혁신할 수 있도록 지원합니다. 이 회사는 AI 시대를 맞이하여 업계에서 가장 광범위하고 혁신적인 기술 및 서비스 포트폴리오를 고객에게 제공합니다.

NVIDIA 설계 리뷰 보드가 승인한 솔루션:

HPE는 AI, 클라우드 및 네트워킹의 역량을 결합하여 조직이 더 많은 성과를 달성할 수 있도록 지원하는 필수 엔터프라이즈 기술 분야의 리더입니다. 가능성의 선구자로서 당사의 혁신과 전문성은 사람들이 생활하고 일하는 방식을 발전시키고 있습니다. 우리는 산업 전반의 고객이 운영 성과를 최적화하고 데이터를 통찰력으로 변환하며, 그들의 영향력을 극대화할 수 있도록 지원합니다. HPE를 통해 가장 대담한 야망을 실현하세요.

NVIDIA 설계 리뷰 보드가 승인한 솔루션:

Lenovo는 매출 690억 달러 규모의 글로벌 기술 강국으로, 포춘 글로벌 500대 기업 중 196위를 기록하고 있으며, 180개 시장에서 매일 수백만 명의 고객에게 서비스를 제공합니다. 모두를 위한 더 스마트한 기술을 제공한다는 과감한 비전을 바탕으로, NVIDIA와의 지속적인 파트너십을 통해 Lenovo 서버와 가속 GPU를 결합하고 있습니다. NVIDIA 기반의 Lenovo Hybrid AI Advantage™는 Lenovo AI 라이브러리와 AI 인프라, 장치, 솔루션 및 서비스로 구성된 풀스택 포트폴리오를 기반으로 하는 더 빠른 AI 배포를 통해 생산성과 혁신을 높입니다.

NVIDIA 설계 리뷰 보드가 승인한 솔루션:

Supermicro는 애플리케이션 최적화 종합 IT 솔루션 분야의 글로벌 리더입니다. 캘리포니아주 산호세에 설립되어 본사를 두고 있는 Supermicro는 엔터프라이즈, 클라우드, AI 및 5G 통신/엣지 IT 인프라를 위한 시장 최초의 혁신을 제공하기 위해 노력하고 있습니다. 서버, AI, 스토리지, IoT, 스위치 시스템, 소프트웨어 및 지원 서비스를 갖춘 종합 IT 솔루션 공급업체입니다. Supermicro의 마더보드, 전원 및 섀시 설계 전문성은 개발 및 프로덕션을 더욱 지원하여 글로벌 고객을 위해 클라우드부터 엣지에 이르기까지 차세대 혁신을 지원합니다.

NVIDIA 설계 리뷰 보드가 승인한 솔루션: