【装机指南】第四代霄龙EPYC Genoa选购方案解析

2017年,AMD发布初代EPYC。它通过多芯片封装和巨大的处理器插槽尺寸赚足了眼球,那时的旗舰和打败竞争对手Xeon 8180之间还有不少距离,可一半的价格和超越Xeon的核心数仍然引人注目。这意味着蛰伏多年的AMD吹响反击的号角,去和intel抢夺服务器这块利润率极高的大蛋糕。

不知不觉,自初代EPYC Naples发布伊始,至今已五载有余。在二手市场,Naples早已是洋垃圾一般的售价,32核的单路款式仅需千余元,搭建64核的当年旗舰平台成本在五千元左右——售价的变迁忠实地记录了处理器市场的沧海桑田。而现在的AMD,早已经筹备完它最新的第四代霄龙。

【装机指南】第四代霄龙EPYC Genoa选购方案解析

多芯片封装:却道“海棠依旧”

希望大家还能回忆起初代EPYC Naples,包括此后发布的Ryzen Threadripper的一些细节——如果因为时间久远而忘记了,那么我将帮您从记忆长河中再捡拾回来。Xeon为了保证各核心相近的缓存延迟表现,并尽可能降低延迟,大动干戈地把使用多年的环形总线换为网格总线,同时单颗XCC Die就直接集成28核+38.5MB L3缓存,成本惊人。为了中端和低端市场,还要设计面积更小、核心更少的新Die,这进一步提升了总体设计和生产成本。

【装机指南】第四代霄龙EPYC Genoa选购方案解析
除28核的XCC Die,intel还要提供HCC和LCC Die来降低中端和低端产品线的成本

由于早些年的产品表现不尽人意,彼时AMD自然是没有经济实力用同样的方式和intel对垒。于是它另辟蹊径,只设计8核的Die,单Die就能制造桌面端拳头产品Ryzen,四个Die用MCM封装“合体”就摇身一变成为最高32核的旗舰。由于每块芯片都有各自独立的双内存通道和PCIE通道,最终产品有8通道内存和128条PCIE3.0,扩展性相当不错。来到核心数越来越多,工艺更新进一步提升工本费的现在,多芯片封装比起从前更像是必要的设计了。

在此之后,AMD更换了设计思路。CPU运算核心和缓存独立出来,使用更先进的制程工艺,一个芯片仍然搭载8核。而内存通道和PCIE等杂七杂八的外围链接部分则由I/O Die提供。这样,先进制程工艺和相对更落后的工艺可以同时出现在一颗CPU里,进一步降低了成本。值得一提的是,intel今年最新发布的第四代至强可扩展Sapphire Rapids,采用的仍然是初代EPYC的设计思路,但毕竟时代更晚,EMIB硅互联封装的连接性能不可同日而语。

【装机指南】第四代霄龙EPYC Genoa选购方案解析
EPYC Genoa CPU架构框图

EPYC Genoa的思路和Rome/Milan完全相同,但各方面都有明显增强。计算Die使用5nm制程,采用最新的Zen4架构,单CPU最高12个计算Die,带来整整96颗核心,依然是AMD长久以来重视单路性能的设计思路。I/O Die制程跨越式进步,从GF 12nm直接换用成熟的TSMC 6nm,然而面积依然巨大,可见规模增加之迅猛。在这片I/O Die,AMD塞下十二通道DDR5和128条PCIE5.0。双路系统用掉各自48条通道互联,最高160条PCIE的恐怖规格,非常适合作为多GPU高性能计算系统的中继。

【装机指南】第四代霄龙EPYC Genoa选购方案解析

“芯”潮澎湃的新变化

抛开我们下一章会详细解析的核心数不谈,看到新产品的第一眼,我想大家就会发现核心数增加带来的副作用——巨大的芯片尺寸。由于没有像intel那样使用走线密度更高的硅互联,AMD需要大量基板面积用于Die间数据交换的走线,以及更多针脚来连接内存和PCIE,封装尺寸因而扩大到LGA6096,相比竞争对手的LGA4677,它宽度大得多,对主板面积的挤占已经到了影响不可忽视的地步。

【装机指南】第四代霄龙EPYC Genoa选购方案解析

除此以外,它的功耗上升也很明显。通过上面这张图表我们可以看到,随着CPU核心数量膨胀,旗舰产品的功耗一直在提升。不过Die的总面积提高可以一定程度上降低对服务器散热的要求,功耗增加看起来唬人,影响可能也没有多配置一两块GPU来得大。旗舰产品型号还提供了cTDP调节的选项,用户可以在节能和高性能之间根据需求灵活选择,这也能减轻功耗膨胀对散热和供电造成的压力。

AMD对新技术的支持亦不容小觑。抛开PCIE和内存的版本更新,EPYC Genoa支持了AVX-512。它仍然像初代EPYC对AVX2的支持那样采用两个256Bit单元拼合的方式,但通过规模优势,AMD还是可以取得相当亮眼的性能,追赶竞争对手;既然新产品已经备齐PCIE5.0物理层的条件,它也没有落下对CXL协议的支持。通过CXL,PCIE运算设备可以访问到内存和Cache,CPU也可以访问PCIE设备的内存,并最终实现整个节点内存的池化,以及可以通过PCIE的插卡直接为整个节点扩展内存容量。

【装机指南】第四代霄龙EPYC Genoa选购方案解析
一些CXL协议的应用场景

总而言之,EPYC Genoa作为服务器旗舰产品,对新技术的支持比较超前,面对intel的竞争,即使在功能性的层面而不是仅看规模还能做到不落下风,这在初代EPYC的时代是难以想象的。

【装机指南】第四代霄龙EPYC Genoa选购方案解析

型号解析:简洁的产品线

相比AMD移动端CPU巨大的型号数量,需要照顾架构从Zen2到Zen4、核显从Vega到RDNA3的混乱场面不同,EPYC型号倒是一如既往地简洁,甚至不像竞争对手intel那样为普通市场、云服务、5G、虚拟化和存储去做产品的细分。当然,未来AMD也会发布一个名为Bergamo的全新系列,它通过使用Zen4的缩水架构Zen4C节省了单核占据的面积,在单插槽可以带来整整128颗核心,可以预见将会拥有更高的多核性能,和更佳的能耗比表现。

【装机指南】第四代霄龙EPYC Genoa选购方案解析

首先纵观全局,AMD通过后缀将处理器分成三种类别。P后缀意味着仅支持单路,不过AMD单颗处理器也能提供96核以及128PCIE扩展性,对于大多数用户已经足够。F后缀是高频高功耗版,意在大幅度拉高频率,提供更均衡的单核和多核性能,适用于单核和多核混合负载的工作站。这个F字母以前放在型号内部,如75F3、74F3。像7D12、7D13这种超低频多核低功耗型号,应该会被Bergamo接手,适用于那些高集成度又需要多核性能的设备。

以下分析一些典型的型号:

EPYC 9654/P:绝对的旗舰产品。96核组建单路工作站已经相当够用,也可以和对手以及自家上一代的双路中高端型号打个来回。双路型号可以提供192核/384线程,看这篇文章的人有99%用不上这么多核心线程数。竞品双路Sapphire Rapids最高120核,然而比起处处不如人的Ice Lake,intel终于把最高8插槽的扩展性救了回来。这样1U/2U机架就能搭载4插槽最多240核,足以打败AMD旗舰。超微还有6U机架的8插槽系统,最高480核。这当然会带来成本显著增加,性能却使AMD难以企及。

至于单路工作站,intel在部分型号开放超频。多核性能当然离AMD的96核路途遥远,但单核性能就有保障,应对混合负载得心应手,并且不花费多开发一套LGA20xx的成本也能应付HEDT金主的需求。我也乐于见到W-3175X发布至今有合格的后来者。至于在未来AMD是否愿意提供一个抬高功耗限制、甚至可超频的96核心旗舰型号,去抢夺这一丁点市场的弹丸之地,就要让时间来证明了。

【装机指南】第四代霄龙EPYC Genoa选购方案解析
W-3175X——你们还记得它吗?

EPYC 9554/P:相比96核的高性能高价格,这是更均衡的选择。它核心数与前代旗舰相同,通过更高的功耗限制和CPU核心的升级,比前代旗舰又更强悍。如果AMD单路HEDT产品线还能存在,那么它就足以超过intel的56核W-3400旗舰。回头望望曾经沧海,i7-5960X/i7-6950X和旗舰E5有巨大的核心数差距,而EPYC已经和Ryzen Threadripper核心数齐平。AMD未来的旗舰HEDT到底是继续保持这样的核心数,满足部分用户并维持自己的巨大性能优势,还是顾及市场需求,不继续做96核这样许多HEDT用户似乎根本用不上的产品线呢?

24核到48核的F后缀CPU也值得选,它们的性能超过桌面端最强旗舰,还不至于因为频率上不去,像那款16核型号那样用不上400w的cTDP上限。单路工作站型号想来也会配置相应的核心数去满足普通用户的需求。工作站主板不像服务器那样背板接口缩得可怜,还会配备集成声卡等服务器近乎完全用不上的零组件,更适应个人用户需求。

EPYC 9124:不知道是难以压低成本,需求太少还是因为觉得这么大个插槽的8核太过可笑,总之目前最弱的EPYC也有16核心——可能你在前文看习惯了那些旗舰型号,觉得这核心数少得可怜了。但是回到现实,桌面端的最强旗舰可也只有16核啊!AMD仍然为这一型号保留完整PCIE和内存带宽,适合内存密集型应用,作为PCIE中继连接一堆GPU/FPGA插卡或者超高带宽存储也非常不错。

【装机指南】第四代霄龙EPYC Genoa选购方案解析

然而,虽然我们之前刚刚吐槽过intel的产品线纷繁复杂,但这时候intel的优势就来了!你们能从上面这张表格挑出最适合的竞品型号吗?没错,就是至强金牌6434H。它TDP 195w,“只有”8核16线程——其实都是Golden Cove大核,放在桌面端多核性能也是中端水准。80条PCIE5.0看起来当然逊于AMD,可是因为intel用UPI总线进行多路互联,双路系统PCIE数量就是和AMD完全一致的160条了。并且这款处理器拥有4插槽扩展性,4颗就有32核心,32通道内存和恐怖的单节点320条PCIE,同时服务器的总体拥有成本还能控制在相对合理的程度。

【装机指南】第四代霄龙EPYC Genoa选购方案解析
intel的MCC核心也提供80条PCIE5.0,或许是为了对战AMD。

总而言之,如果只对新平台的扩展性望眼欲穿,并且能够接受多处理器带来的体积,那么intel或许在这个细分市场更有优势,值得选择。为多CPU互联专门增设难以挪作他用的UPI总线,也是intel相比于AMD更重视多路处理器系统的表现。

【装机指南】第四代霄龙EPYC Genoa选购方案解析

部分主板和准系统解析

新处理器固然很好,但美中不足的是,单路主板由于CPU尺寸和扩展性的缘故已经拥挤不堪。尤其是那些还想选择ATX尺寸的用户——即使是从前被称为“大板”的ATX也不得不在内存和PCIE之间取舍,实在令人唏嘘。MATX甚至要同时割舍两者。或许旗舰单路用上SSI-EEB、PCIE改成Oculink/SlimSAS节约空间才是我们一眼可知的未来?

【装机指南】第四代霄龙EPYC Genoa选购方案解析

这张和下面一张主板的定位都是普通塔式服务器的主流型号。这张永擎主板采用了纵向加长0.1英寸的MATX版型,在右下角勉强挤下四个SlimSAS 8i和一个SlimSAS 4i,这样终于花掉36条PCIE5.0。内存通道实在是无地自容,就不得不减少到8通道来省出一点空间,仅仅这样,整张主板已经满满当当。至于许多玩家还在心心念念的LGA6096 ITX平台……就让它遁入梦境幻想的泡影之中吧。

【装机指南】第四代霄龙EPYC Genoa选购方案解析

超微的ATX H13SSL-N,根据以往的表现,将是绝对的主流型号。它终于拉满12通道内存,在艰难的抉择下用两条M.2把PCIE x16挤成x8。这样的PCIE扩展性未免显得有些可怜——即使是H11SSL-i这样受到诟病的型号也能多塞一条PCIE5.0!可是我想看完这张主板的布局,应该没有人责怪超微,毕竟内存和处理器从来没有像现在这样挤占空间。最后,这张主板有支持万兆网络的版本,上一张永擎MATX主板也支持万兆网络,比较适合软路由(?)

【装机指南】第四代霄龙EPYC Genoa选购方案解析

这张主板是Tyan为机架式服务器打造的,它看起来很像SSI-EEB,还支持24Pin标准ATX供电,可是比标准版型宽1英寸——这些以兼容性为代价换来的宝贵空间留作8个SlimSAS 8i,整整64条PCIE5.0的用度。CPU终于用满了12通道2DPC,总共24条内存插槽,相当于256GB×24=6TB的内存上限,随着单条内存容量增大,还会继续增加。它还支持OCP3.0网卡,100Gb的带宽也不在话下。

【装机指南】第四代霄龙EPYC Genoa选购方案解析

超微的机架式4U主力型号AS-4125GS-TNRT。同样因为CPU和内存占据太多宽度,它尽最大努力只能做到1DPC,双路24条内存插槽。作为4U多GPU服务器,它倒是很轻松地用满了所有的PCIE通道。比起繁花似锦的intel服务器产品线,AMD没有那样丰富的服务器SKU选择,不过说成“门前冷落鞍马稀”也远不至于。除了以上型号,还有不少面对各种应用场景的产品,此处不再花费更多篇幅。

【装机指南】第四代霄龙EPYC Genoa选购方案解析

参考&引用

1.部分图片来自intel、AMD、CXL官方PPT;Supermicro、Tyan官网。

2.部分产品参数来源于intel ARK、AMD官网。

给TA打赏
共{{data.count}}人
人已打赏
站外热文

amd 全新装机只在淘宝,因为有保质

2023-1-16 14:41:29

站外热文

剪短装机风扇自己接头教程

2023-1-16 16:01:15

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索