史上最强笔记本CPU AMD锐龙4000架构解析:7nm Zen2浴火重生
从2017年3月到现在,AMD重返高性能X86市场已经三年了。
在此期间,AMD推出了3代锐龙处理器、2代霄龙处理器,开始对桌面、笔记本、数据中心等三大主要市场发起攻击,其中桌面市场最为成功,其次是数据中心市场,笔记本市场最为艰难。
为何笔记本电脑这块骨头最难啃?因为笔记本市场占了全球PC出货量的7成,体量超大不说,而且对CPU的要求高多了——因为要考虑到续航、散热,笔记本CPU不是性能或者性价比就能解决的,需要一揽子方案,各方面都要做好。
现在AMD终于有强力的笔记本处理器上市了,这就是今年CES展会上推出的锐龙4000系列处理器,使用了7nm Zen2架构,这是Zen2家族中来的最晚的一款产品,但也是最受期待的。
有关锐龙4000系列笔记本处理器的产品介绍我们之前已经发过文章了,本文的重点是架构,我们来看看它们的架构解析,深入了解一下AMD都做了哪些改变才让锐龙笔记本成为真香选择的。
一切的起点:7nm Zen2包打低功耗到高性能全部市场
AMD的Zen2处理器去年就发布了,大部分参数大家都耳熟能详了,它是首款7nm工艺的X86处理器,并且在CPU微内核上做了大量提升,包括2倍的OP缓存、2倍的L1数据缓存、2倍的L3缓存等等。
详细的Zen2架构我们之前做过介绍,可以参考这篇文章——AMD Zen2架构深度揭秘:100%翻新 单核性能完美。简单总结就是Zen2的IPC性能提升了15%(实测提升21%),浮点性能翻倍,多核数量翻倍,桌面轻松做到了16核32线程,服务器做到了64核128线程。
此外,AMD在这代处理器上是本着“一个架构打天下”的思路做的,就是用一款架构去覆盖低功耗的移动市场到桌面、HEDT发烧级平台,再到服务器平台的。
AMD的这种设计思路很好很强大,一个CPU架构囊括多种市场可以有效减少开发难度,节约时间,降低开发成本。
如果仔细看AMD官方的资料,大家会发现其实这个架构也是分为两种类别的,桌面、HEDT、服务器三者基本是一样的,只有规模大小的不同,而代号Renior(雷诺阿)的移动版锐龙4000系列其实就不一样了,它没有使用chiplets小芯片设计,而是回归传统思路,做了一颗高集成度的SoC处理器。
至于为什么,AMD发布的ISSCC论文其实解释过了,因为在8核及以内的CPU中,使用小芯片的收益越来越小,成本降低的有限,而笔记本处理器对芯片的发热、功耗及封装体积更加敏感。
总之,在锐龙4000笔记本处理器上,AMD实际上是把7nm Zen2核心重构了一遍,跟其他产品的架构有所不同,目的就是满足笔记本市场特殊的需求。
7nm锐龙4000处理器:2倍晶体管密度 体积还小了25%
AMD之前表示锐龙4000系列处理器开发了至少三年,这大概也是它来得比做桌面版至少玩半年的原因吧,好在AMD交出的答卷是让人满意的,没白等这段时间。
首先来看整体效果,7nm锐龙4000 APU处理器在7nm工艺下的塞进了98亿晶体管,密度翻倍,核心面积156mm2,但封装体积只有25x35x1.38mm,比上代的锐龙3000系列APU处理器还小了25%。
在这样的条件下,锐龙4000系列APU处理器集成了最多8个7nm CPU核心、7nm Vega GPU核心、Infinity Fabric总线、LPDDR4X/DDR4主控,还有各种NVMe、PCIe、SATA、USBC、USB 3.1等IO接口。
最后出来的结果就是这样一款超高集成度的锐龙4000处理器,不论CPU、GPU性能、功能还是IO接口,亦或者是安全性,该有的都有了。
锐龙4000笔记本处理器:CPU IPC性能提升15% L3缓存有精简
在锐龙4000系列APU处理器上,CPU微内核跟桌面版的Zen2是一样的,IPC性能大约也提升了15%,这里就不详细介绍了,之前的文章中已经详细阐述了。
此外,锐龙4000的APU也针对功耗做了优化。
不过笔记本的锐龙4000还是有一些区别的,比如CCX单元的L3缓存,桌面版/服务器版是16MB,而笔记本减少到了4MB,主要原因在于L3缓存太占空间了,笔记本还是要考虑体积的,同时也有利于降低功耗。
锐龙4000系列处理器之GPU:Vega今又来 性能大提升
与桌面版锐龙3000无需集成核显不同,锐龙4000笔记本处理器需要iGPU,也就是核显,而AMD的目标又很大,他们的核显性能一直很强,这次更是直接塞入了7nm Vega GPU核显,性能能顶轻薄本常用的25W独显。
略微遗憾的是锐龙4000系列笔记本处理器没用上RDNA架构,之前AMD解释说时间上来不及,锐龙4000是3年前开发的了,当时只有Vega架构是最新的。
不过Vega架构GPU在7nm工艺上也获得了重生,AMD不仅改进了性能,还用各种手段提升了能效,CU单元减少的同时提升了25%的峰值频率,带宽也增加了77%。
最后的结果就是,在同样的TDP功耗限制下,锐龙4000的7nm Vega浮点性能达到了1.79TFLOPS,3DMark的DX12测试Time Spy性能比上代12nm Vega提升了59%,性能显著提升。
在视频编码解码方面,锐龙4000也升级了解码单元,速度提升了31%,并且支持新的HDR/WCG编码。
其他的VP9、H.264及H265/HEVC编码中,4K 60Hz甚至4K 120Hz也不在话下了。
锐龙4000系列之能效:同TDP下单核大涨25%
正如前面所说,锐龙4000处理器是面向笔记本的,提升CPU及GPU性能是一方面,更重要的问题在于提升性能的同时还要降低能耗,这就要求能效非常高,锐龙4000因此成为AMD能效最好的CPU。
根据AMD所说,在同样15W TDP的限制下,锐龙4000处理器的CPU性能提升了25%,反过来说就是同样的性能下,功耗也能降低25%。
AMD表示锐龙4000处理器中每单元的能效比提升一倍,其中7nm工艺带来了1.47x的提升,IPC贡献了1.15x的提升,设计带来了1.17x的提升。
在多线程性能上,锐龙4000处理器实现了2倍的每瓦性能比,其中25%左右的贡献来自IPC及设计优化,75%左右都是来自7nm工艺。
在Ifinity Fabric总线上,AMD也降低了每带宽的能耗,先进的7nm工艺、动态功耗优化实现了75%的能效提升,低功耗下带宽提升了77%。
锐龙4000系列之续航:OS系统级优化
除了提升能效之外,锐龙4000系列处理器还在续航优化上下足了功夫,新增了OS系统级的低功耗状态,还改善了各种功耗状态的切换延迟。
在上代的笔记本处理器中,ACPI中只有一种功耗状态,锐龙4000处理器中增加到了三种,不同状态的切换、控制也更灵活,不再完全依赖OS调度。
针对音频,AMD推出了ACP(Audio Controlller)功能,因为一些语音识别助手,比如微软的Cornata、亚马逊的Alexa,它们是需要常驻后台的,但又不能因为它们一直保持全速状态,需要保持低功耗但又能及时响应,AMD这个功能开启后能节省20%的功耗。
锐龙4000处理器之IO接口:LPDDR4、NVMe、USBC全到齐了
作为一个平台,笔记本不光是处理器重要,IO接口也很重要,在这一点上锐龙4000也圆满了,主流的接口都给配齐了,包括4xPCIe通道、NVMe及USB-C等。
内存方面,锐龙4000系列集成了双通道内存主控,支持LPDDR4X-4266及DDR4-3200内存,带宽分别达到了68.3GB/s、512GB/s。
USB-C接口也是未来的趋势,锐龙4000原生支持USB-C接口,速率10Gbps,能够支持2路4K显示器输出,比USB4及Thunderbolt 3还要强悍。
最后,锐龙4000系列处理器还在安全性下了功夫,普通消费者对这个问题感知不强,但是商业用的笔记本对安全性有较高的要求。
总之,在锐龙4000系列笔记本处理器上,AMD不仅仅是升级了CPU及GPU两大核心单元,而是从整个平台的角度全面提升了锐龙笔记本的潜力,同样的功耗下,CPU性能大涨25%,GPU性能提升60%,光这两点就足够让它取代目前轻薄本中常见的CPU+25W GPU的组合了。
放宽功耗的话,AMD的锐龙4000H系列也直接杀到了游戏本市场,以往AMD在这方面有所欠缺,这次轻薄本、游戏本一举两得了。