엔터프라이즈 레퍼런스 아키텍처

확장 가능한 AI 팩토리 구축하기

NVIDIA 엔터프라이즈 레퍼런스 아키텍처로 데이터센터를 고성능 AI 팩토리로 전환하세요.

개요

AI 성공을 위한 핵심 구성 요소

NNVIDIA 엔터프라이즈 레퍼런스 아키텍처는 조직이 검증되고 반복 가능한 인프라를 사용하여 고성능 AI 팩토리를 설계, 배포, 확장할 수 있도록 지원합니다. 이러한 설계는 인증된 컴퓨팅, 고속 동서 및 남북 네트워킹, 관측 도구 및 소프트웨어를 결합하여 4노드 클러스터부터 엔터프라이즈 규모의 환경에 이르기까지 확장 가능한 성능을 보장합니다.

Palantir, NVIDIA와 협력하여 소버린 AI 운영 체제 레퍼런스 아키텍처 제공

Palantir 소버린 AI OS 레퍼런스 아키텍처는 NVIDIA 엔터프라이즈 레퍼런스 아키텍처(RA)를 기반으로 하며, NVIDIA AI 인프라에서 Palantir의 전체 소프트웨어 제품군을 실행할 수 있도록 테스트와 인증을 완료했습니다.

보도 자료 읽기

검증된 설계 및 검증된 성능

실제 배포와 실전에서 검증된 구성을 기반으로 구축된 엔터프라이즈 레퍼런스 아키텍처(RA)가 어떻게 확장 가능한 AI 인프라를 위해 계획을 간소화하고 ROI를 극대화하는지 알아보세요.

백서 읽기

엔터프라이즈 레퍼런스 아키텍처

전체 제품군 가이드

데이터 센터에서 클러스터를 구축하기 위한 종합적인 설정 가이드를 지금 확인하실 수 있습니다.

인프라

NVIDIA 엔터프라이즈 레퍼런스 아키텍처는 CPU-GPU 네트워킹 노드 패턴, 케이블 연결 다이어그램, 인프라 세부 정보를 포함한 검증된 하드웨어 구성으로 시작합니다.

네트워크 로직

엔터프라이즈 RA를 위한 네트워킹 구성 및 논리 아키텍처 로직 가이드에는 NVIDIA Air에서 VLAN 설계 및 네트워크 시뮬레이션을 통해 노드 관리 및 프로비저닝 가이드가 제공됩니다.

소프트웨어

엔터프라이즈 레퍼런스 아키텍처를 위한 소프트웨어 레퍼런스 스택은 인프라 클러스터의 관리, 프로비저닝(배포), 및 사이징(규모 산정)에 사용되는 소프트웨어 구성을 설명합니다. 현재 버전은 오픈소스 Kubernetes를 중심으로, NVIDIA AI Enterprise와 NVIDIA Run:ai 소프트웨어에 초점을 맞추고 있습니다.

가시성

NVIDIA 엔터프라이즈 레퍼런스 아키텍처를 위한 관측 가능성 가이드는 Prometheus 및 Grafana와 같은 오픈 소스 도구를 활용하여 전체 클러스터 전반의 GPU 및 네트워킹 성능을 모니터링합니다. 대시보드는 시스템 상태 및 워크로드 효율성에 대한 실시간 지표를 제공합니다.

배포

NVIDIA 엔터프라이즈 레퍼런스 아키텍처를 위한 배포 가이드는 우리 팀이 프로그램을 구축한 자체 클러스터를 시작, 배포, 테스트, 검증하여 배운 인프라 모범 사례 모음입니다.

스토리지

NVIDIA 인증 스토리지 프로그램은 엔터프라이즈 RA와의 통합을 위해 전용 스토리지 가이드를 제작한 주요 파트너사들이 함께 참여하는 협력 프로그램입니다. 이 독특한 프로그램에 대해 자세히 알아보세요.

사용 사례

모든 사용 사례를 위한 설계

글로벌 파트너의 검증된 NVIDIA 엔터프라이즈 레퍼런스 아키텍처와 NVIDIA 인증 시스템을 통해 에이전틱 AI, 피지컬 AI, 고성능 컴퓨팅(HPC) 및 AI 시뮬레이션 워크로드를 가속화하세요. 엔터프라이즈 AI 팩토리 배포를 위한 주 인프라 클러스터 구성의 개요는 아래와 같습니다.

NVIDIA RTX PRO AI 팩토리
NVIDIA HGX AI 팩토리
NVIDIA NVL72 AI 팩토리

NVIDIA RTX PRO AI 팩토리

NVIDIA RTX PRO™ AI 팩토리 구성은 생성형 및 에이전틱 AI, 데이터 분석, 비주얼 컴퓨팅 및 엔지니어링 시뮬레이션을 포함한 광범위한 엔터프라이즈 워크로드를 위해 설계되었습니다. 배포는 16노드 및 32노드 설계 기준을 중심으로 최적화되어 성능, 확장성 및 배포 효율성 간의 이상적인 균형을 제공합니다. 엔터프라이즈 AI, 시뮬레이션 및 비주얼 컴퓨팅 전반에 걸쳐 범용 워크로드 가속화를 위해 설계된 NVIDIA RTX PRO 서버는 PCIe 환경에 최적화되어 공간, 전력 및 냉각 제약이 있는 데이터 센터에 이상적입니다. 최신 AI 워크로드를 위해 특별히 구축된 이 제품은 에이전틱 AI 및 대규모 언어 모델(LLM) 추론을 위한 효율적인 성능을 제공합니다.

클러스터 구성 사양 보기

NVIDIA HGX AI 팩토리

고성능 NVIDIA HGX™ AI 팩토리 구성은 NVIDIA HGX 시스템을 활용하여 멀티 노드 AI 학습 및 대규모 추론을 위해 특별히 구축되었습니다. 32, 64 및 128노드 설계 지점에서 제공되며 NVIDIA Spectrum-X™ 네트워킹이 지원되는 이 아키텍처는 유연한 레일 최적화 설계를 특징으로 하며, 다양한 랙 레이아웃 전반에서 효율적인 통합을 가능하게 하는 동시에 고처리량과 저지연 성능을 제공합니다. 가장 까다로운 워크로드를 실행하는 AI 파워 사용자에게 획기적인 성능을 제공하고, 대규모 모델 학습 및 미세 조정을 지원하며, 추론을 획기적으로 가속화합니다. 차세대 정밀도와 초고속 상호 연결을 통해 이 솔루션은 최대 15배 더 높은 토큰 처리량을 달성합니다.

클러스터 구성 사양 보기

NVIDIA NVL72 AI 팩토리

NVIDIA NVL72 AI 팩토리 구성은 1조 개의 매개변수 모델을 학습하고 배포하도록 설계되어 단일 랙 내에서 엑사스케일 컴퓨팅 파워를 제공합니다. 대규모 모델 처리량, 멀티 사용자 추론 및 대규모 실시간 추론을 위해 구축된 이 제품은 차세대 AI 기반 혁신을 지원합니다. 배포 설계 포인트는 4랙 및 8랙 구성을 중심으로 중점을 둡니다. 유연한 레일 최적화 네트워크를 기반으로 구축된 이 아키텍처는 다양한 랙 레이아웃 및 시스템 설계에 유연하게 대응하는 동시에 고대역폭 및 저지연 성능을 제공합니다. 이 플랫폼은 업계 최고의 에너지 효율과 함께 탁월한 AI 팩토리 성능을 제공하며, 5세대 NVIDIA NVLink™, FP4 Tensor 코어 및 첨단 열 관리 기술을 기반으로 합니다.

클러스터 구성 사양 보기

이점

엔터프라이즈 RA의 전략적 가치

검증된 파트너 준비 구성으로 확장 가능한 고성능 AI 인프라를 활용해 보세요.

AI 워크로드를 위한 최고 성능

멀티 노드 클러스터 전반에서 전체 GPU 활용도와 성능 일관성을 보장하는 아키텍처를 통해 AI 추론, 미세 조정 및 학습의 집약적인 요구 사항을 충족하세요.

유연한 확장, 운영 간소화

인프라를 쉽게 확장하고 최대 128노드까지 확장 가능하고 간소화된 배포를 보장합니다. 소프트웨어 에코시스템을 활용하는 NVIDIA 엔터프라이즈 AI 팩토리 검증 설계를 통해 풀스택 솔루션을 위한 기반을 구축하세요.

복잡성 및 TCO 감소

배포 프로세스와 효율적인 설계를 간소화하고, 복잡성과 총 소유 비용(TCO)을 줄이는 동시에, 가치 창출 시간을 단축하세요.

지원 용이성

특정 표준화된 설계 패턴을 따라 설치 간 일관된 운영을 달성하고, 반복적인 지원의 필요성을 줄이는 동시에 더 빠른 문제 해결 시간을 지원합니다.

파트너

성능을 위한 협업

저희는 주요 파트너들과 협력하여 그들이 엔터프라이즈 레퍼런스 아키텍처와 AI 팩토리 솔루션을 시장에 선보이는 것을 자랑스럽게 생각합니다. 이러한 파트너들의 승인된 설계는 NVIDIA의 설계 검토 위원회(Design Review Board)의 심사를 통과하였으며, 인프라, 네트워킹 로직, 소프트웨어 등 하나 이상의 분야에서 NVIDIA의 인증을 받을 수 있는 가이드를 제공합니다.

시작하기

NVIDIA를 활용한 Palantir 소버린 AI OS 레퍼런스 아키텍처

Palantir 소버린 AI OS 레퍼런스 아키텍처는 NVIDIA 엔터프라이즈 레퍼런스 아키텍처(RA)를 기반으로 하며, 글로벌 시스템 파트너와 협력하여 NVIDIA AI 인프라에서 Palantir의 전체 소프트웨어 제품군을 실행할 수 있도록 테스트와 인증을 완료했습니다. 이 소버린 AI 아키텍처는 지연에 민감한 워크플로우, 데이터 주권 요구 사항 및 광범위한 지리적 분산 환경을 가진 고객에게 핵심적입니다. 이 아키텍처는 기업이 데이터, AI 모델 및 애플리케이션에 대한 완전한 제어권을 가질 수 있도록 지원합니다.

자세히 알아보기

리소스

엔터프라이즈 레퍼런스 아키텍처에 대해 자세히 알아보기

NVIDIA RTX PRO AI 팩토리 레퍼런스 아키텍처

NVIDIA RTX PRO AI 팩토리 구성은 에이전틱 AI 추론, 피지컬 및 산업용 AI, 비주얼 컴퓨팅, 데이터 분석 및 시뮬레이션을 위한 고성능 컴퓨팅(HPC)을 포함한 광범위한 엔터프라이즈 워크로드를 지원합니다. 이 문서는 확장 가능한 모듈형 아키텍처를 뒷받침하는 하드웨어 구성 요소에 대해 자세히 설명합니다.

백서 읽기

NVIDIA HGX AI 팩토리 레퍼런스 아키텍처

NVIDIA HGX AI 팩토리 구성은 고성능 AI 추론, 모델 학습 및 미세 조정에 중점을 둡니다. 이 문서는 클러스터를 상호 연결에 사용되는 클러스터 지침 및 네트워크 패브릭 토폴로지를 포함하여, 확장 가능한 모듈형 아키텍처의 하드웨어 구성 요소에 대한 개요를 설명합니다.

백서 읽기

NVIDIA Run:ai를 활용한 대규모 토큰 처리량 실현

Nebius와의 공동 벤치마킹에 따르면, NVIDIA 엔터프라이즈 레퍼런스 아키텍처에서 NVIDIA Run:ai를 사용하는 분할 GPU 배포가 프로덕션 LLM 워크로드의 처리량과 활용도를 크게 향상시키는 것으로 나타났습니다.

블로그 읽기

NVIDIA 엔터프라이즈 레퍼런스 아키텍처 개요

이 백서는 32개서 1,024개 GPU 규모의 엔터프라이즈급 배포를 위한 AI 팩토리 설계 및 구축에 검증된 지침을 제공하는 NVIDIA 엔터프라이즈 레퍼런스 아키텍처를 소개합니다. 이러한 아키텍처는 AI 인프라 배포를 간소화하고 운영 복잡성을 줄이며, 가치 실현 시간을 단축하는 데 도움이 됩니다.

백서 읽기

남북향 네트워크: 엔터프라이즈 AI 워크로드 가속화의 핵심

NVIDIA 엔터프라이즈 레퍼런스 아키텍처는 남북 및 동서 네트워크를 활용하는 AI 팩토리 구축 시 조직을 가이드하며, 확장 가능하고 안전한 고성능 AI 인프라를 위한 설계 레시피를 제공합니다.

블로그 읽기

새로운 엔터프라이즈 레퍼런스 아키텍처를 활용한 NVIDIA H200 NVL 대규모 배포

NVIDIA H200 NVL은 향상된 메모리, 고속 NVLink 및 최적화된 엔터프라이즈 RA 구성을 통해 AI 배포를 가속화합니다.

블로그 읽기

NVIDIA의 AI 팩토리, 대규모 엔터프라이즈 혁신 주도

NVIDIA는 엔터프라이즈 전반에서 생성형 AI 및 에이전틱 워크플로우를 확장하여 보안, 성능, 일관성을 보장하는 통합 AI 팩토리를 구축했습니다. 이 플랫폼은 혁신을 가속화하고 소프트웨어 및 하드웨어 엔지니어링을 간소화하며 공급망 운영을 최적화하는 수백 개의 AI 에이전트를 지원하여 계획 시간을 95% 이상 단축하고 수십 년에 걸쳐 진행된 엔지니어링 작업을 단 1년 만에 달성합니다.

주요 결과 살펴보기

다음 단계

시작할 준비가 되셨나요?

NVIDIA 엔터프라이즈 AI 팩토리에 대해 자세히 알아보세요.

시작하기

NVIDIA 엔터프라이즈 레퍼런스 아키텍처에 대해 자세히 알아보기

NVIDIA 엔터프라이즈 레퍼런스 아키텍처가 고성능 AI 인프라 배포를 위한 확장 가능하고 규정적인 청사진을 제공하는 방법을 살펴보세요.

백서 읽기

Supermicro는 애플리케이션 최적화 종합 IT 솔루션 분야의 글로벌 리더입니다. 캘리포니아주 산호세에 설립되어 본사를 두고 있는 Supermicro는 엔터프라이즈, 클라우드, AI 및 5G 통신/엣지 IT 인프라를 위한 시장 최초의 혁신을 제공하기 위해 노력하고 있습니다. 서버, AI, 스토리지, IoT, 스위치 시스템, 소프트웨어 및 지원 서비스를 갖춘 종합 IT 솔루션 공급업체입니다. Supermicro의 마더보드, 전원 및 섀시 설계 전문성은 개발 및 프로덕션을 더욱 지원하여 글로벌 고객을 위해 클라우드부터 엣지에 이르기까지 차세대 혁신을 지원합니다.

NVIDIA 설계 리뷰 보드가 승인한 솔루션:

자세히 살펴보기

CPU (적용 가능)	2x 64c Intel Xeon 2x 64c AMD EPYC
GPU	8x NVIDIA RTX PRO™ 6000 Blackwell 서버 에디션
네트워킹(동서향)	4x NVIDIA® BlueField®-3 B3140H (1x 400 Gb)
네트워킹(남북향)	1x BlueField-3 B3220 (2x 200 Gb)
호스트 메모리(최소)	최소 1,024GB DDR5 ECC(슬롯당 DIMM 1개)
호스트 부팅 드라이브(최소)	1x 1 TB NVMe
호스트 스토리지(최소)	4TB NVMe 2개

CPU (적용 가능)	2x 64c Intel Xeon 2x 64c AMD EPYC
GPU	8x NVIDIA Blackwell Ultra GPU
네트워킹(동서향)	8x NVIDIA® BlueField®-3 B3140H (1x 400 Gb)
네트워킹(남북향)	1x BlueField-3 B3220 (2x 200 Gb)
호스트 메모리(최소)	최소 1,536GB DDR5 ECC(슬롯당 DIMM 1개)
호스트 부팅 드라이브(최소)	1x 1 TB NVMe
호스트 스토리지(최소)	4TB NVMe 2개

CPU	2x 72c NVIDIA Grace™ (랙당 36)
GPU	4x NVIDIA Blackwell GPUs (랙당 72)
네트워킹(동서향)	4x NVIDIA® ConnectX®-7 (1x 400 Gb)
네트워킹(남북향)	2x NVIDIA BlueField®-3 B3240 (4x 200 Gb)

엔터프라이즈 레퍼런스 아키텍처

확장 가능한 AI 팩토리 구축하기

AI 성공을 위한 핵심 구성 요소

Palantir, NVIDIA와 협력하여 소버린 AI 운영 체제 레퍼런스 아키텍처 제공

검증된 설계 및 검증된 성능

전체 제품군 가이드

인프라

네트워크 로직

소프트웨어

가시성

배포

스토리지

모든 사용 사례를 위한 설계

NVIDIA RTX PRO AI 팩토리

NVIDIA HGX AI 팩토리

NVIDIA NVL72 AI 팩토리

엔터프라이즈 RA의 전략적 가치

AI 워크로드를 위한 최고 성능

유연한 확장, 운영 간소화

복잡성 및 TCO 감소

지원 용이성

성능을 위한 협업

NVIDIA를 활용한 Palantir 소버린 AI OS 레퍼런스 아키텍처

엔터프라이즈 레퍼런스 아키텍처에 대해 자세히 알아보기

NVIDIA RTX PRO AI 팩토리 레퍼런스 아키텍처

NVIDIA HGX AI 팩토리 레퍼런스 아키텍처

NVIDIA Run:ai를 활용한 대규모 토큰 처리량 실현

NVIDIA 엔터프라이즈 레퍼런스 아키텍처 개요

남북향 네트워크: 엔터프라이즈 AI 워크로드 가속화의 핵심

새로운 엔터프라이즈 레퍼런스 아키텍처를 활용한 NVIDIA H200 NVL 대규모 배포

NVIDIA의 AI 팩토리, 대규모 엔터프라이즈 혁신 주도

다음 단계

시작할 준비가 되셨나요?

NVIDIA 엔터프라이즈 레퍼런스 아키텍처에 대해 자세히 알아보기

클러스터 구성 2-8-5-200 사양

클러스터 구성 2-8-9-400 사양

클러스터 구성 2-4-6-400 사양