不用小核也很猛,第12代酷睿Alder Lake-S同频性能测试
经过漫长的等待,英特尔在2021年底正式推出了第12代酷睿处理器Alder Lake-S桌面版。Alder Lake-S是英特尔首批大规模量产的10nm桌面版处理器,此前称之为10nm Enhanced SuperFin(现在重命名为Intel 7,和业内的节点标准相匹配),这对英特尔来说意义重大,标志着其在轻薄本、游戏本、服务器、台式机等所有产品线都完成了工艺制程与微架构的全面换代,14nm和Skylake两位老朋友将彻底告别舞台......
除了工艺制程的换代之外,Alder Lake-S运用了众多新技术、支持很多新标准,最明显的特性就是采用了Hybrid混合架构设计,性能核也就是P-Core采用了Golden Cove微架构,能效核E-Core则是Gracemont,最多高规格为8+8核心/24线程。此外对DDR5内存以及PCIe 5.0协议的支持,则标志着Alder Lake-S平台整体的全面升级。
首批上市的Alder Lake-S高端产品均应用了Hybrid混合架构设计,也就是搭配了4到8个E-Core能效核,英特尔表示新一代能小核Gracemont旨在面对当今多任务场景做到充分优化,提高了吞吐量效率并提供可扩展的多线程性能。观察die shot可以发现,4个Gracemont和1个Golden Cove大小相当,都占用了1个Ring节点,但4个Gracemont组成集群后多线程性能会比1个Golden Cove开启超线程之后更强,因此PPA角度上来看,Gracemont显然比Golden Cove要好得多,能在有限的硅片空间内实现更强的多核任务负载。
Alder Lake-S采用Hybrid混合架构设计则是兼顾了Golden Cove与Gracemont二者的共同有点,致力于做到单线程与多线程两个维度的全面提升。不过Hybrid混合架构设计和ARM的big.LITTLE相似,都需要软硬件的合理调度优化才能让性能最好发挥。为此Alder Lake-S内置了英特尔硬件线程调度器ITD来进行引导,并针对最新Windows 11操作系统进行优化设计,致力于在合适时间将恰当的线程置于相应的内核上,从而确保这两种全新内核微架构的无缝衔接。
不过对于很多用户,尤其是游戏玩家来说,他们更关注Alder Lake-S中性能核Golden Cove的表现,能效核Gracemont带来的多线程性能提升则是起到锦上添花的作用;甚至很多玩家还准备关闭能效核,在有限的功率和散热能力下将性能核超到更高的频率。PConline评测室针对第12代酷睿处理器Alder Lake-S,除了综合性的首发评测之外,还针对性能核Golden Cove进行了单独测试。
英特尔10nm与新架构的曲折之路
在性能测试开始前,我们先来简单回顾一下历史,英特尔在2014年(Tick年)底成功量产了14nm工艺制程,推出Broadwell家族的酷睿M系列产品,而在2015年(Tock年),Intel则利用良率逐步走向成熟的14nm工艺制程将Skylake微架构的第6代酷睿全面推向市场;而那几年AMD还在推土机泥潭中挣扎,Skylake甚至Haswell都能够做到酷睿i3默秒全......
根据早期的路线图,如果英特尔能够持续延续Tick-Tock节奏,那么会在2016年(Tick年)量产10nm制程工艺的Cannon Lake(微架构继承Skylake),在2017年(Tock年)进行下一轮微架构升级,将Ice Lake推向市场......
不过在当时,没人能预测到原定计划服役2-3年的Skylake微架构会在桌面平台被使用长达5年之久,由于10nm工艺制程的种种问题,且英特尔所遵循的“工艺制程与微架构相捆绑“原则,英特尔迟迟不能将新架构的产品推向桌面市场,第7代酷睿Kaby Lake-S、第8-9代酷睿Coffee Lake-S乃至第10代酷睿Comet Lake-S等一系列产品,虽然都有新的Code Name,但本质却都是Skylake微架构的马甲,内核IPC没有变化,主要是依靠增加核心线程数量,以及拉高核心睿频来获得性能提升。2021年初,面对AMD Zen 3的凌厉攻势,英特尔终于有所动作,将原本基于10nm节点设计Sunny Cove微架构backport“反向移植”到14nm节点上进行生产,这就是代号为Rocket Lake-S的第11代酷睿处理器桌面版。
不过客观来说Rocket Lake-S并不是一代很成功的产品,将为10nm节点设计的微架构反向移植到14nm节点上,势必会产生很多新问题。Cypress Cove微架构为了提高IPC,每核心的规模也就是晶体管数量相比Skylake微架构做到了显著增加,而采用低密度的14nm节点来生产,势必导致面积及功耗的增长。最终酷睿i9-11900K只有8核心16线程,芯片面积却比10核心20线程的酷睿i9-10900K还要更大,且满载功耗变得更高了.......
虽然在桌面平台长期停滞于14nm节点,但英特尔近年来的微架构设计还是做到了稳步推进。在2020年后,英特尔推出的Tiger Lake系列第11代酷睿处理器移动版采用了Willow Cove微架构,Willow Cove相当于Sunny Cove的小幅增强版,改进了缓存设计,每核心拥有更大容量的L2和L3缓存(IPC对比Sunny Cove提升只有个位数,几乎可以忽略不计),并在10nm SuperFin技术的加持下频率大幅提升。而本篇文章的主角,第12代酷睿Alder Lake-S采用性能核Golden Cove则是Willow Cove的下一代升级版。
新一代性能核Golden Cove简介
前文提到过,Alder Lake采用的P-Core性能核代号为Golden Cove,但不同于Willow Cove对Sunny Cove微调缓存式的小幅升级,Golden Cove是称得上Tock级别升级的全新微架构,整体的变化非常大,官方宣传称Golden Cove的设计目标旨在提高速度,突破低时延和单线程应用程序性能的限制,以及更好地支持代码体积较大的应用程序。
为了进一步提高IPC,Golden Cove的设计宗旨是更宽、更深、更智能。微架构的前端解码器由4个增至6个,6µop缓存增至8µop。
ROB乱序重排缓冲区部分,Golden Cove则达到了恐怖的512队列,相比于Sunny Cove和Willow Cove的352队列增加40%以上,是AMD Zen 3架构的2倍,仅次于苹果M1大核心Firestorm的630队列。
wide allocation分配由5路增至6路,执行端口由10个增至12个。具体到整数执行引擎部分,Golden Cove增加了第五个整数执行端口。
矢量浮点执行部分,虽然没有增加端口,但额外添加了新的FADD加法计算单元。
二级缓存部分,Golden Cove可配置每核心1.25MB或每核心2MB,其中面向消费级的Alder Lake-S为每核心1.25MB,这一点与第11代酷睿Tiger Lake的Willow Cove相同。至于面向数据中心领域的Sapphire Rapids,则配备每核心2MB二级缓存。
具体的性能方面,英特尔表示Alder Lake的性能核Golden Cove是公司有史以来最为强大的x86内核微架构,对比第11代酷睿处理器桌面版Rocket Lake的Cypress Cove,两者运行在相同的3.3GHz频率上,测试SPEC CPU 2017、SYSmark 25、Crossmark、PCMark 10,、WebXPRT3、Geekbench 5.4.1等项目,Golden Cove的平均IPC提升可达19%。
考虑到Cypress Cove对比Skylake已经有了超过两成的IPC提升,而Golden Cove在Cypress Cove的基础上又提升了19%的IPC,可以称得上百尺竿头更进一步!当然对于测试处理器微架构的IPC及提升幅度,变量其实不小,采用不同的测试平台(主板BIOS版本、内存频率和时序、缓存频率、操作系统),测试不同的应用项目,都会对测试结果产生显著的影响。
测试平台简介
测试平台方面,Alder Lake-S选用了旗舰型号酷睿i9-12900K,搭配ROG MAXIMUS Z690 EXTREME主板与金士顿金士顿FURY 16G×2 DDR5-5200CL40内存。参与对比的是Rocket Lake-S和Comet Lake-S平台的旗舰型号,酷睿i9-11900K和酷睿i9-10900K,这两个平台的内存使用宏碁掠夺者PREDATOR 16G×2 DDR4-3600CL16。测试系统为Windows 11专业版。
比较遗憾的是,由于时间紧张,本次同频测试没有加入游戏性能的同频率对比;关注Alder Lake-S游戏表现的玩家,可以关注PConline的综合性首发评测。
通过BIOS将酷睿i9-12900K的所有E-Core能效核关闭,只保留8个性能核,最终规格为8核心16线程,和酷睿i9-11900K相同;酷睿i9-10900K则关闭两个核心,也是保留8核心16线程。为了避免睿频调度的影响,三款处理器均锁频为全核心4.5GHz,Ring也就是缓存频率也锁定为4.3GHz。
ROG MAXIMUS Z690 EXTREME是华硕ROG家族推出的旗舰级产品,外观炫酷、用料豪华,堪称是第12代酷睿Alder Lake-S的最强座驾。
ROG MAXIMUS Z690 EXTREME的BIOS界面和前几代产品基本相同,功能也是非常丰富的。测试前将XMP打开,内存频率为5200CL40-40-40-80,比JEDEC标准要略高一点;由于金士顿FURY 16G×2 DDR5-5200CL40是首批DDR5内存,因此它的频率并不是特别高,时序也不是很好看,希望明年DDR5逐步走向成熟后,出现频率更高时序更低的产品。
另外在额外提一下,在ROG MAXIMUS Z690 EXTREME主板的现有0702版BIOS中,当关闭所有E-Core能效核后,8个P-Core性能核是可以手动打开AVX-512的。就是不知道后续的版本BIOS会对AVX-512做出怎样的处理,有可能会直接屏蔽掉?而到了明年,像酷睿i5-12400这样的纯性能核产品正式发布后,又该如何处理AVX-512呢?我们将持续关注......
纯性能模式下CPU-Z软件所识别的参数,分别是关闭AVX-512与开启AVX-512。
同频测试对比——这次牙膏真的是挤爆了
本次测试包含众多项目,基本覆盖了常见的基准测试工具,包括Cinebench R20、Cinebench R23、V-Ray 4、V-Ray 5、Blender 2.93.5、POV-Ray 3.7.1、Keyshot、Corona1.3、CPU-Z、y-cruncher、Sisoftware Sandra 2021、PCMark 10、3DMark、UL Procyon、Crossmark等等。未来将加入更多测试项目,并与AMD Zen 3微架构的锐龙5000系列桌面处理器Vermeer做更详细的同频性能对比。
先来看一下常见的Cinebench,作为基于Cinema 4D开发的测试软件,Cinebench阴恻测试简单直观而广泛流行,目前已经跟随Cinema 4D一起更新至R23版本。此前Cinebench是英特尔处理器的弱势项目,不但核心数量要比对位的AMD竞品少很多,并且同频性能也不占优势。
而到了第12代酷睿Alder Lake-S,针对Cinebench的同频性能有了很大的提升,实测在R20及R23版本中,Golden Cove对比第11代酷睿Rocket Lake-S的Cypress Cove单线程有超过22%的提升,多线程则超过25%,比官方宣布的IPC提升平均值19%还要高出几个百分点;而如果对比Skylake微架构,Golden Cove在R20和R23这两项做到了单线程提高超过40%,多线程提升超过50%,这个幅度非常恐怖!
CPU-Z同样是流行的基准测试软件,包含不同的项目以分别调用处理器的不同指令集运行,测试时采用1.97版本。Golden Cove对比Cypress Cove的同频性能提升也超过20%,高于Cypress Cove对Skylake的提升幅度。
V-Ray是由专业的渲染器开发公司CHAOSGROUP开发的渲染软件,是业界最受欢迎的渲染引擎。本次测试的是V-Ray 4和V-Ray 5两个版本的独立benchmark,显示Golden Cove对比Cypress Cove的同频性能提升都超过了22%。
POV-Ray,全名是Persistence of Vision Raytracer,是一个使用光线跟踪绘制三维图像的开放源代码免费软件,在GitHub上面下载3.7.1版本进行测试。此前Cypress Cove对比Skylake在这个项目中的同频提升只有12-13%,而本次测试Golden Cove对Cypress Cove在本项目的同频提升则高达24%以上。
Blender 是一款开源的跨平台全能三维动画制作软件,提供从建模、动画、材质、渲染、到音频处理、视频剪辑等一系列动画短片制作解决方案,目前最新版本为2.93.5,导入Classroom素材进行渲染,记录消耗时常。这项Golden Cove对比Cypress Cove同频提升也超过了20%。
KeyShot 意为“The Key to Amazing Shots”,是一个互动性的光线追踪与全域光渲染程序,无需复杂的设定即可产生相片般真实的 3D 渲染影像。目前也推出了独立的测试工具KeyShot Viewer Benchmark,这项Golden Cove对比Cypress Cove同频提升同样超过了20%。
Corona Render渲染器是业界后起之秀,在渲染质量和速度上其实非常优秀,目前提供了Corona 1.3 Benchmark基准测试程序。Golden Cove在这项测试中表现一般,同频对比Cypress Cove提升只有11%左右。
使用3DMark对处理器进行测试,首先是Fire Strike、Time Spy和Time Spy Extreme三个项目中的物理分数。Golden Cove对比Cypress Cove,在Time Spy和Time Spy Extreme两项的同频提升幅度在12-13%左右,Fire Strike项目提升为21%。
CPU Profile是3DMark新版推出的处理器性能测试项目,可测试处理器不同线程负载下的性能表现。此前Cypress Cove对比Skylake在CPU Profile场景中表现出色,不过Golden Cove在却在此项目中提升较为有限。
PCMark 10 含有一整套全面的测试项,涵盖现代办公场所中的各种任务,是被广泛认可的计算机综合性能测试软件,除了处理器以外,内存、显卡、固态硬盘性能也会影响分数。运行PCMark应用程序测试项目(Office+Edge),Golden Cove对比Cypress Cove同频提升超过17%。
UL Procyon是为专业用户打造的基准测试组件,目前推出了办公室生产力基准测试项目,使用微软Office应用程序来衡量电脑的办公生产力工作性能。该基准测试的特点是使用微软 Word、Excel、PowerPoint 和 Outlook 模拟真实的任务。Golden Cove对比Cypress Cove在此项目中同频提升超过18%。
Crossmark是BAPCo组织开发的基准测试软件,覆盖创造力、生产力和响应速度三大维度,对处理器的单线程性能有很高要求。此项测试中Golden Cove对Cypress Cove的同频提升达到15%。
y-cruncher是一款计算圆周率的软件,能够较好的利用AVX-512指令集及其拓展,同时也对内存的带宽提出很高要求。得益于DDR5内存更高的带宽,即便不开启AVX-512,只是用AVX2的执行文件,Golden Cove的多线程计算效率也会更强。当然,如果BIOS里选择开启AVX-512,提升还会更加显著。
Sisoftware Sandra 2021版同样对AVX-512指令集做了很多优化,因此当时测试第11代酷睿Rocket Lake-S时,Cypress Cove对Skylake做到了超过40%的提升。而对于Alder Lake-S来说,在这项测试中,性能核Golden Cove即便不开启AVX-512也能和Cypress Cove开启AVX-512打成平手,BIOS关闭能效核、手动开启AVX-512后则做到了进一步提升。
写在最后——总结与展望
汇总本次的测试项目成绩,第12代酷睿Alder Lake-S的性能核Golden Cove对比第11代酷睿Rocket Lake-S采用的Cypress Cove,在绝大多数应用场景中都有很明显的性能提升(平均提升达到18.2%),特别是像Cinebench、V-Ray、Blender、POV-Ray等多线程渲染项目,Golden Cove的同频提升都达到了20-25%,进化幅度幅度比Cypress Cove对Skylake还要大一些。另外,与AMD Zen 3的同频测试数据对比正在汇总......
如果跨度更大一些,与当前英特尔桌面平台处理器中存量最高的Skylake微架构去对比,Golden Cove在以上这些常用基准测试中可以获得30-50%的同频性能提升。因此对于使用第8代-第10代酷睿的用户来说,即便完全不考虑能效核Gracemont,只看性能核Golden Cove的IPC表现,第12代酷睿处理器Alder Lake-S的升级幅度依旧是巨大的。
在英特尔On技术创新峰会活动中的媒体专访环节中,英特尔客户端计算事业部副总裁、客户端计算事业部中国业务总经理Sunil Kaimal表示,Alder Lake的产能将逐步爬坡,除了已经上市的台式机处理器外,明年年初将发布面向移动端的产品,英特尔的目标是在明年第一季度发行200万颗以上的Alder Lake系列新品。
得益于巨大的性能提升和众多平台新特性,最新的Alder Lake-S第12代酷睿毫无疑问是追求极致性能体验的玩家的首选!当然在很长一段时间内,市场中将会是多代产品共存的,前面的一代甚至更老的产品线也不会立即停产,玩家可以根据自己的预算进行选购。
在2021年,历经磨难的10nm工艺制程在良率和产能方面逐渐走上正规,同时频率也能做到了5.0GHz以上,不再是拖后腿的存在,能够在各个产品线完成对14nm的全面取代。而微架构方面经过了Skylake到Cypress Cove再到Golden Cove的两次进化,IPC效率提升显著,彻底摆脱了“高频低能”的尴尬境况。再结合Gracemont能效核带来的多线程提升,以及DDR5、PCIe 5.0等新特性,第12代酷睿处理器桌面版Alder Lake-S可以称得上一次全面的换代升级。
在帕特·基辛格回归后,英特尔提出了非常激进的路线图规划,我们也期待英特尔能够加快产品开发进度,让未来新品的微架构设计和工艺制程都获得持续更新,不要让2015-2020年期间祖传14nm Skylake的历史再一次上演......
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。
本文地址:/bijiben/66833.html