首页 / 日本VPS推荐 / 正文
英伟达Ai服务器内部结构解析,英伟达ai服务器内部结构图

Time:2025年01月03日 Read:11 评论:42 作者:y21dr45

背景介绍

英伟达Ai服务器内部结构解析,英伟达ai服务器内部结构图

随着人工智能技术的迅猛发展,AI服务器在各类高性能计算任务中扮演着越来越重要的角色,英伟达(NVIDIA)作为全球领先的GPU制造商,其推出的DGX系列AI服务器凭借强大的性能和创新的设计,在市场上占据重要地位,本文将详细解析英伟达AI服务器的内部结构,以帮助读者更好地理解其技术特点和优势。

目录

1、英伟达AI服务器概览

- 服务器分类及基本架构

- DGX A100与DGX H100简介

2、硬件拆解与功能分析

- 风扇模组与硬盘存储

- GPU板组与CPU母板组

- 电源模组与其他配件

3、核心技术解析

- GPU技术与NVSwitch

- CPU与内存配置

- 高速互联与网络接口

4、软件生态与应用

- 操作系统与基础软件

- 典型应用场景与案例分析

5、未来展望

- 英伟达的新一代AI服务器展望

- AI服务器市场的未来趋势

6、

- 英伟达AI服务器的优势与特点

- 对未来技术发展的影响

一、英伟达AI服务器概览

服务器分类及基本架构

英伟达的AI服务器主要分为两大类:DGX A100和DGX H100,这些服务器通常由以下五个主要硬件板块构成:

风扇模组:包括8个风扇,用于散热。

硬盘存储:配备8个3.84TB的硬盘,合计提供30TB的存储空间。

GPU板组:最核心的组件之一,包含GPU、模组板和NVSwitch。

CPU母板组:包括CPU母板、系统内存和网卡等。

电源模组:提供电力支持,并配备厚铜PCB板。

下表总结了英伟达DGX A100和DGX H100两款AI服务器的主要硬件配置:

部件 DGX A100 DGX H100
GPU 8 x A100 Tensor Core GPU 最新H100 Tensor Core GPU
CPU 2颗AMD Rome 7742处理器 4颗基于Grace Hopper的CPU
内存 1TB DDR4内存 标配1TB DDR5内存,可扩展到2TB
存储 30TB(8 x 3.84TB硬盘) 更高容量的NVMe SSD
网络接口 Mellanox ConnectX-6 InfiniBand或Ethernet
电源 6组电源 高效能电源模块
液体冷却 传统风扇冷却 最新DTC液冷技术

2. DGX A100与DGX H100简介

DGX A100是英伟达推出的一款具有标杆性产品力的AI服务器,外形类似于常见的家用主机,通过对部件构成进行深度分解,可以发现其大体上可以分为以下五个硬件板块:

风扇模组:从前部入手,首先看到的是风扇模组板块,DGX A100的风扇模组由8个风扇组成,这一搭配与传统服务器8U规格的基本一致。

硬盘:前部风扇模组板块的下方摆放了硬盘和前控制台板(控制与外接设备的信号传输),DGX A100配备了8个3.84TB的硬盘,合计内部存储30TB。

GPU板组:后部是整个AI服务器的关键组件组装区域,最核心的板块就是GPU板组,这也是AI服务器区别与普通服务器的关键,从DGX A100的架构来看,GPU板组主要包含GPU组件、模组板和NVSwitch三块,这三块都会涉及到不同类型的PCB产品。

CPU母板组:这一部分是所有服务器的核心部件(包括普通服务器和AI服务器),其中包含CPU母板、系统内存、网卡和PCIE Switch等部件,CPU母板、系统内存和网卡是主要涉及到PCB用量的部分。

电源模组:DGX A100后部的下方还配有6组电源,电源内部会涉及到厚铜PCB板的使用。

二、硬件拆解与功能分析

风扇模组与硬盘存储

1.1 风扇模组

DGX A100的风扇模组由8个风扇组成,这一搭配与传统服务器8U规格的基本一致,风扇模组的主要功能是通过空气流动来降低服务器内部的温度,确保各个组件能够在适宜的温度下工作。

1.2 硬盘存储

DGX A100配备了8个3.84TB的硬盘,合计提供30TB的内部存储空间,这些硬盘在前部风扇模组板块的下方,通过前控制台板与外接设备进行信号传输,如此大容量的存储对于需要处理大量数据的AI应用尤为重要。

GPU板组与CPU母板组

2.1 GPU板组

GPU板组是DGX A100的核心组件之一,主要包括GPU组件、模组板和NVSwitch。

2.1.1 GPU载板

英伟达A100的GPU和DRAM采用2.5/3D先进封装工艺,用于承载的板材采用70*70mm~100*100mm、14~16层的FCBGA载板,按照DGX A100搭载8颗GPU的数量来看,一台AI服务器需要用到8颗GPU载板,根据产业链调研,单颗价值量约为100美元,即650元人民币/颗,单机GPU载板价值量为5200元。

2.1.2 NVSwitch

NVSwitch是基于NVLink标准用于GPU之间通信的基础模组,搭载NVSwitch的载体是类似于载板的产品,加工性要求较简单,关键是承担多数据量高速传输的性能,根据产业链调研,单颗价值量约为30美元,即195元/颗,按A100搭载6颗计算可得单机价值量为1170元。

2.1.3 OAM(GPU加速卡)

OCP Accelerator Module中文简称为GPU加速卡,是用于承载GPU芯片的板卡,数量上看,OAM与GPU存在一一对应的关系,以DGX A100搭载8个GPU的数量来看,一台AI服务器需要用到8块OAM,面积上借鉴PCIE版本267.7mm*111.15mm的尺寸规格,可测算出OAM的面积尺寸约为0.03平方米,由于OAM涉及到GPU高速多线路信号传递,根据产业链调研,DGX A100 OAM的SXM版本需要用到20层、Ultra Low Loss等级CCL材料、4阶HDI工艺,对应产品单价为12000元/平方米,而PCIE版本相对规格较低,只需要用到14层、Ultra Low Loss和高Tg FR4等级CCL材料混压、1阶HDI工艺,对应产品单价7000元/平方米,综合来看,如果按照DGX A100机型配置,高端AI服务器的OAM单价价值量将达到2880元。

2.1.4 UBB(Unit Baseboard)

UBB是用于搭载整个GPU平台的PCB板,一台AI服务器对应一块UBB,根据DGX A100整机底面规格和产业链调研,预估UBB面积约为0.30平方米,需要用到26层通孔PCB板,CCL材料运用Ultra Low Loss,对应单价约为10000元/平方米,对应单机价值量为3000元。

综上合计,英伟达DGX A100 GPU板组主要由GPU载板、NVSwitch、GPU加速卡和GPU模组板四部分组成,四部分合计单机PCB面积达到0.624平方米,对应PCB单机价值量为12250元,其中载板级别的产品单机价值量为6370元、占比52%,PCB级别的产品单机价值量5880元、占比48%。

2.2 CPU母板组

CPU母板组是所有服务器的核心部件,包括CPU母板、系统内存和网卡等。

2.2.1 CPU载板

CPU载板与GPU载板规格相近,如果按单颗CPU载板价值量100美元、DGX搭载2颗CPU计算,则单机价值量约为1300元。

2.2.2 CPU主板

主要用于承载

排行榜
关于我们
「好主机」服务器测评网专注于为用户提供专业、真实的服务器评测与高性价比推荐。我们通过硬核性能测试、稳定性追踪及用户真实评价,帮助企业和个人用户快速找到最适合的服务器解决方案。无论是云服务器、物理服务器还是企业级服务器,好主机都是您值得信赖的选购指南!
快捷菜单1
服务器测评
VPS测评
VPS测评
服务器资讯
服务器资讯
扫码关注
鲁ICP备2022041413号-1