当前位置:网站首页>大缓存更强劲,搭载AMD Milan-X的浪潮GPU服务器NF5468A5深度评测
大缓存更强劲,搭载AMD Milan-X的浪潮GPU服务器NF5468A5深度评测
2022-08-08 11:30:00 【小磊】
NF5468A5是一款4U支持2颗AMD EPYC处理器和8颗双宽GPU卡,面向AI训练、推理、视频编解码等多种应用场景的GPU服务器。此次测试采用分别搭载2颗AMD Milan-X 7773X、Milan 7543和Rome 7742的配置组合。
AMD Milan-X处理器最大的亮点,就是采用3D堆叠技术(3D V-Cache),在不改变处理器面积的前提下,可用L3 缓存(SRAM)总数增加三倍。做个形象的比喻,这种3D堆叠技术就像将把相同面积的平房升级成三层小楼,通过纵向空间成倍扩展缓存数量。评测采用的NF5468A5平台是浪潮信息畅销海内外的弹性云AI服务器NF5468系列的全新产品,率先支持PCIe 4.0技术,4U空间内可装载2颗采用7nm先进制程工艺的AMD EPYC处理器和8块PCIe Gen4接口的AI加速卡,能够最大限度的发挥Milan-X处理器的极致性能。
WRF(The Weather Research and Forecasting Model),即天气预报模式,被誉为是次世代的中尺度天气预报模式,往往用于大范围高分辨的气候模拟,对系统的运算性能、内存的要求非常高;OpenFOAM(Open Source Field Operation and Manipulation)是对连续介质力学问题进行数值计算的软件,经常应用于汽车仿真等行业,进行仿真计算需要处理大量的实时数据,所以对系统的计算能力、数据吞吐能力都有很高的要求。
基于浪潮NF5468A5评测报告显示,Milan-X处理器通过搭载3D堆叠技术获得更高的L3缓存,确实对计算性能有较大提升,而性能改进意味着企业可以在更少的服务器上运行相同的作业,消耗的功率也能有明显降低。如下是评测报告中的性能测试数据:

在WRF测试中,使用单节点相同核心数,以Rome 7742处理器运行时间为基准,在Milan 7543上的计算性能提升14%~27%,而在Milan-X 7773X处理器上性能提升 23%~34%。

在OpenFOAM基准算例motorBike测试中,使用不可压稳态求解器simpleFoam计算模拟摩托车和骑手周围空气的运动情况。同样以Rome 7742处理器为基准,OpenFOAM在Milan 7543处理器使用单节点相同核心测试性能提升23%~28%,在Milan-X 7773X处理器上性能提升34%~80%。
在本次评测中也对NF5468A5有比较细致的介绍,据浪潮官网显示NF5468A5正在推出“超值机型 限免试用”,对该GPU服务器感兴趣的不妨一试。如下是评测中对于浪潮NF5468A5的介绍:
NF5468A5采用分区散热设计,内置独立的CPU和GPU主板,且分别安装在不同的平面。从机箱内部结构来看,设计者将发热量高的的GPU放在了机箱上3U空间,CPU板处于机箱下1U,内置6对12个6056风扇模组配合导风罩,实现机箱内风道分流,正是基于这种独特分层散热设计,使得送测的NF5468A5服务器可以支持280W最高功耗的Milan-X 7773X。系统设计支持32条DDR4 ECC内存,支持LRDIMM/RDIMM,提供高达8T的本地内存,实现与1536 MB 超大L3 cache间的高速数据交互。
NF5468A5采用了CPU直连GPU架构设计,率先支持PCI-E 4.0技术,最大限度提升CPU与GPU间的带宽,降低通信延迟,达到最佳效能,为客户提供极致优化的算力。系统提供丰富的IO扩展能力,提供10个PCIe 4.0 X16扩展槽位,支持8个全高全长的GPU加速卡。提供灵活存储方案,可选前置12 × 3.5英寸硬盘或24 × 2.5英寸硬盘,提供超大的本地存储能力,同时最大可支持8个热插拔NVMe SSD全闪配置,提供存储到内存到L3 cache的高速访存,可实现十倍于高端企业级SATA SSD的IOPS性能,带来极致IO存储性能飞跃。
边栏推荐
- SQL 语言的详解 --- 最最基础的内容!!! 刚学完常复习
- (kali - elevated privileges 】 【 4.2.4) social engineering toolkit: remote control trojans use, set up and use
- NLP和CV中的Local和Global建模
- day02 -DOM—高级事件(注册事件、事件监听、删除事件、DOM事件流、事件对象、阻止默认行为、阻止事件冒泡、事件委托)—常用鼠标事件—常用的键盘事件
- 刷题《剑指Offer》day12
- 小程序使用npm包
- 【力扣】两数相加
- Mysql索引优化实战
- Leetcode 617. 合并二叉树
- 自学脚手架——《热学》 by 李椿(第一,二,三,四,五章)
猜你喜欢

Hystrix熔断器
![(原创)[C#] GDI+ 之鼠标交互:原理、示例、一步步深入、性能优化](/img/97/c19480b21bc183563fc985a2429bda.jpg)
(原创)[C#] GDI+ 之鼠标交互:原理、示例、一步步深入、性能优化

刷题《剑指Offer》day12

深度学习网络结构图绘制工具及方法

STM32的内存管理相关(内存架构,内存管理,map文件分析)

卫星互联网真能替代 5G?

上海控安SmartRocket系列产品推介(二):SmartRocket Modeler可视化建模开发工具

五、树结构

#yyds Dry Goods Inventory#【Yugong Series】August 2022 Go Teaching Course 005-Variable
![[Horizon Rising Sun X3 Trial Experience] WIFI connection, SSH login, TogetherROS installation (section 2)](/img/86/e562e377343fa1a06120d27b40eee9.png)
[Horizon Rising Sun X3 Trial Experience] WIFI connection, SSH login, TogetherROS installation (section 2)
随机推荐
我用开天平台做了一个城市防疫政策查询系统【开天aPaaS大作战】
LeetCode_487_最大连续1的个数Ⅱ
Software testing testing on behalf of the user
MongoDB是什么,怎么用?
Study Notes: CS520 Knowledge Graphs
易周金融分析 | 互联网系小贷平台密集增资;上半年银行理财子公司综合评价指数发布
3D激光SLAM:LIO-SAM整体介绍与安装编译
彻底弄清楚session,cookie,sessionStorage,localStorage的区别及应用场景(面试向)
One article to understand configuration management (CM)
LeetCode 219. Repeating Elements II (2022.08.07)
文档数据库中的文档有什么用呢?
About the Celery service report under win Process 'Worker' exited with 'exitcode 1' [duplicate]
七、图结构
动图图解!既然IP层会分片,为什么TCP层也还要分段?
8/7 牛客6+div2D+倍增lca
分布式系统设计策略
office安装出现了“office对安装源的访问被拒绝30068-4(5)”错误
Kunpeng Developer Creation Day 2022: Kunpeng Full-Stack Innovation and Developers Build Digital Hunan
京东云无线宝产品部负责人张晓东 : 京东云无线宝与开源的亲密关系 | 《大神详解开源 BUFF 增益攻略》讲座回顾...
gaussdb数据库连接报错:psycopg2.OperationalError: server closed the connection unexpectedly