注(2):以下是所有已推出的处理器、构建基于第12代酷睿的新系统的注意事项-冷却器、主板、内存和超频,以及新CPU的性能评估。在英特尔的2021年架构日上,英特尔分享了他们大胆的新愿景和解决方案系列,以让业界人士和媒体对从2021年末到2022年的未来印象深刻,其中包括超薄和轻型设备,通过服务器等。
对于客户端计算领域,AlderLake代表了英特尔在重新设计其处理内核方面所做的工作,并推动了ARM处理器长期以来一直吹捧的更强大的大核+小核实现,但在x86ISA领域.Lakefield试图迈出第一步,但实际上并没有以极少的设计胜利而起飞,即便如此,它还是沦为超轻薄的笔记本电脑和平板电脑细分市场,其性能无可厚非。
AlderLake最终将通过适用于台式机、笔记本电脑和平板电脑或轻薄产品的可扩展且强大的处理器设计解决方案来解决这个问题。
跳上奥尔德湖火车意味着什么
在我们深入细节之前,让我们分享一些关键亮点,比如你需要一个新的主板,因为台式机AlderLake芯片需要一个新的LGA1700插槽,技嘉更早泄露了这个插槽。其次,AlderLake支持业界首创的DDR5内存,其设计要求是在DIMM上进行内存电压调节,这与早期的内存模块完全不同。
第三,AlderLake将成为业内第一个过渡到PCIe5.0连接的公司,比AMD的进步更上一层楼。这些是AlderLake整体平台能力的重大变化,不可避免地需要新的主板和随附的硬件来完成其性能故事。
使用全新平台也意味着您无疑也将获得Wi-Fi6E和Thunderbolt4支持,只要主板芯片组层和随附的PHY设备支持这些标准。可以理解,不同的主板层可能会选择支持/排除某些功能,但作为AlderLake平台的概述,您可以获得行业领先的内存和互连技术。
窥视引擎盖下
现在事情变得更有趣了。与大多数处理内核相同的高性能处理器不同,AlderLake结合了两种不同类型的处理内核——代号为GoldenCove的性能内核和代号为Gracemont的高效内核——形成了下一代性能混合处理器。为了使用“Intel7”工艺技术制造,AlderLake将拥有各种设计用于9W至125WTDP的CPU,适用于超移动、笔记本电脑和台式机客户端。从TDP的TDP范围来看,这表明AlderLake甚至可以适合用于超频的高性能DIY机器。
除了同名之外,这两种核心类型的使命有何不同?
高效的x86内核旨在提高吞吐量效率并为现代多任务处理提供可扩展的多线程性能。
性能x86内核旨在提高速度并突破低延迟和单线程应用程序性能的极限。
使用这两种类型的内核将使AlderLake很难与诸如SunnyCove等CPU架构进行比较和对比,SunnyCove是我们目前在系统中看到的IceLake和TigerLake处理器的中流砥柱。但是,如果我们必须总结英特尔为AlderLake中使用的GoldenCove和Gracemont所做的更改,内部管道以与Skylake首次亮相时相同的方式得到了极大的增强:更宽、更深、更智能、更优化等等高效。
在Efficientx86核心(Gracemont)中,它已通过更准确的分支预测器来增强,以筛选更深的条目和更大的结构大小,将L1指令缓存大小翻倍至64KB,包含更多指令解码器(六个而不是四个),17个执行端口(从通常的10个增加),内存子系统中更深的缓冲和改进的预取器,并支持更现代的指令集,例如具有AI扩展的高级矢量指令,添加了更多浮点寄存器来处理乘法累加(FMUL)和快速添加(FADD)指令使FP处理吞吐量翻倍。
在Performancex86核心(GoldenCove)上,除了类似的管道改进以使用更多解码器处理更广泛的代码外,还增加了微操作事务率、更好的分支预测和处理更大代码的能力、改进了与另一个ALU和LEA整数处理的并行性由于双FADD矢量执行单元,单元和类似的FP吞吐量增加,这个性能核心现在拥有更新的智能电源管理控制器,用于更细粒度的控制和电源预算管理。它还增加了一个新的矩阵引擎(英特尔AMX)用于AI加速的涡轮增压矩阵乘法。被称为高级矩阵扩展(AMX)单元,这是一个平铺矩阵乘法加速器,每个内核每个周期最多可容纳八倍的操作,以节省传统上用于获取、解码和乱序管理周期的功率。
现在,打包两种不同的内核类型并不能自动解决指令、线程和操作系统如何管理这种新的混合设置。进入新的英特尔线程控制器技术,这是动态处理指令/线程所需的一种新的关键硬件解决方案,可以准确地对其进行优先级排序并将它们分配给适当的内核以实现最佳效率,同时考虑手头的任务优先级、性能需求(无论是它是后台或前台任务)、核心温度/电源状态等等,无需用户输入。
从本质上讲,英特尔线程控制器以极高的精度监控所有运行时指令及其混合,并向操作系统提供运行时反馈,以优化任何工作负载的调度决策。
随着Windows11的出现,英特尔保证即将推出的操作系统更擅长处理任务和流程,以更好地使所使用的硬件受益。因此,英特尔线程控制器技术(以及由此产生的线程控制器提示)与Windows11携手合作,实现了迄今为止的最佳性能效率。Windows开发人员还可以指定所需的QOS(服务质量)并调用正确类型的内核,因为他们利用更新的软件编译器来瞄准这些新的CPU,这可能很快就会成为新常态。
桤木湖业绩预期
英特尔表示,在单线程处理场景中,与Skylake内核相比,新的Efficientx86内核可提供高达40%的性能提升,同时功耗降低40%。在四线程处理方案中,这些数字上升了80%,但自从基于Skylake的处理器于2015年(大约六年前)首次亮相以来,我们确实对这些数字持怀疑态度。要理解英特尔为什么要进行这种比较,重要的是要了解即使是当前的SunnyCove架构仍然源自Skylake。
请注意,这些数字基于使用SPECrate2017int_base结果的单个应用程序。我们自己在运行SPEC基准测试方面的经验通常是原始功率的一个指标,并不能转化为具有高度可变工作负载的实际客户端性能。因此,请注意这一性能提升,并注意它与2015年首次亮相的架构进行比较。
请注意,这些数字基于使用SPECrate2017int_base结果的单个应用程序。我们自己在运行SPEC基准测试方面的经验通常是原始功率的一个指标,并不能转化为具有高度可变工作负载的实际客户端性能。因此,请注意这一性能提升,并注意它与2015年首次亮相的架构进行比较。
AlderLake作为一个整体与英特尔的第11代酷睿处理器相比又如何呢?使用常见的行业标准基准,例如SPECCPU2017、SYSmark25、PCMark10、WebXPRT3和Geekbench5.4.1(我们在测试中也经常使用其中的许多基准),英特尔声称在相同核心频率下平均性能提升19%。请注意,这一理论主张仅来自处理器自身的架构进步,还没有考虑到新的封装、内存、平台、互连升级等。
当然,在某些情况下,AlderLake的性能可能低于同等的第11代酷睿处理器,当我们与英特尔高管深入研究时,他们分享说新处理器放弃了AVX-512指令支持以及当前任何应用程序和进程严重依赖这一点会导致他们预测的性能损失。但是,由于AlderLake对核心设计进行了大修,英特尔认为这不会引起太大的关注,并且仍然应该提供比第11代酷睿处理器更好的整体主张。
AlderLake处理器配置
在撰写本文时,英特尔尚未分享他们期望拥有的确切处理器SKU,但他们确实给我们留下了一些关于最高配置处理器的一些想法,该处理器将具有多达16个内核(具有8个性能和8个高效核心),同时执行多达24个线程(通过每个性能核心双线程和每个效率核心单线程),以及总计30MB的最后一级缓存。
上述配置是针对桌面级AlderLake处理器,而幻灯片上的图像提示表明,典型的移动级性能处理器最多可具有14个内核(具有6个性能和8个高效内核),以及一个超移动低-power包可能有多达10个内核(具有2个性能内核和8个高效内核)。
不要忘记AlderLake将支持DDR5(和DDR4)、PCIe5.0、Thunderbolt4和Wi-Fi6E,为了使这一切成为可能,处理器块内的互连吞吐量已大大扩大,高达1,000GB/s计算结构、204GB/s内存结构和64GB/sI/O结构。
如果混合可扩展架构成功,以及英特尔在过去几年中一直在为此做准备,AlderLake将彻底重新发明高性能多核架构。
预计基于AlderLake客户端的处理器将于2021年秋季开始推出,距现在不远。
除了计算客户端之外,AlderLake的处理内核还将成为SapphireRapids的框架,这是英特尔的下一代Xeon可扩展处理器,添加了更多以数据中心为中心的优化,使其适用于其服务类别。请继续关注有关此主题的更多报道,以及当英特尔准备充斥市场时分享更多处理器SKU详细信息时。