2020年年底,苹果首次推出基于Arm架构的自研芯片M1,凭借优秀的能效比以及足够强大的硬件性能愣是将X86平台处理器“虐”了个遍,同时引起不少用户对于X86架构处理器的质疑,但事实真的是这样吗?
要厘清这一切首先要明白的一点是,Arm架构和X86架构发展方向并不相同,前者小而精,后者大而全。
X86通常被称为复杂指令集,而Arm自然就是精简指令集。从字面意思上就能看出,X86在指令集方面更加复杂,处理器能力更强,性能更高,对应的功耗也会更高。
对于需要强大性能且不在乎功耗的PC而言,X86指令集能够提供强大的性能、更加全面的指令集以及复杂的电路设计,可以实现更高工作效率,几乎就是强大和全面的代名词。
Arm架构则刚好相反,移动端设备异常关注功耗问题,所以只需要提供够用的指令集数量就行,对于复杂的操作,Arm通常采用指令集组合的方式来完成。
举个具体的例子,如果是通过X86对机器人下达指令开车送自己去目的地,那么只需要对机器人说:开车送我去XX地。
如果通过Arm对机器人下达同样的指令,那么就拆分步骤:1.打开车门,2.放开手刹,3.启动汽车,4.去往目的地点…….
这是两个架构根本上的区别,但为何发展这么多年,Arm架构的其他处理器没能达到苹果M系列芯片的高度呢?
这就不得不提到苹果为提升M系列芯片而做出的努力了,Arm架构芯片在微架构方面的改动往往可以带来感知明显的性能提升,这也体现出苹果在芯片设计方面的强大实力。
以苹果目前最强的M1 Ultra芯片为例,最高版本拥有20核心CPU以及64核心GPU,同时晶体管数量拥有惊人的1140亿个,并且内存带宽达到恐怖的800GB/s,采用台积电5nm制程工艺打造而成。
作为英特尔目前最强的i9-13900K,拥有24颗处理器核心,但是晶体管数量仅有280亿个,最大内存带宽也仅有89.6GB/s,并且采用10nm制程工艺。从纸面参数来看,i9-13900K除去核心数量方面领先M1 Ultra,其他方面都远远落后于M1 Ultra。
激进的硬件堆料为苹果M1 Ultra在部分场景下领先X86架构处理器提供了基础,但M1 Ultra本质上并不算是一颗处理器,而是一块系统级芯片。
苹果将GPU、CPU、统一内存以及大量专用加速模块都塞进了M1 Ultra中。
如此一来就为苹果M系列芯片带来两个好处,首先是高度集成的设计使得芯片在内存传输方面占据巨大优势,这也是为何两者内存带宽有着将近10倍差距的根本原因。
PC平台上无论显卡也好、处理器也好、内存也罢通通各司其职,模块化的设计让各家厂商生产的产品都能完美兼容。
但是在X86架构的PC电脑中,各个硬件之间想要进行通信就需要通过总线,CPU作为PC大脑往往需要统筹所有运算。
如此一来,CPU如果需要读取内存中的一组数据,那么信号首先就需要经过北桥,再经过前端总线才能写入CPU。
想要读取显存中的数据,信号还要从显卡先到内存才能到达CPU。这就好比一个人从公司开车回家,需要绕一大圈才能回家,极大降低了效率。
而苹果M系列芯片将所有硬件都封装在一起,带来的好处是硬件物理距离的极大缩短。并且苹果使用统一内存,让GPU和内存共用一个内存,这样CPU直接读取数据就不用绕一大圈。
此外,苹果通过优化总线,极大提升通信效率。这就相当于将公司搬到家对面,并且家门口到公司门口建了个直达天桥,也就大幅提升CPU和GPU的性能,因此M系列芯片在面对大量随机读写的视频剪辑任务时会有巨大优势。
其次,M系列芯片作为系统封装芯片,有大量专用加速模块,这也是M系列芯片受到追捧的一大原因之一。
针对视频剪辑等特殊工作需求,这些专用加速模块就能带来额外性能提升,所以在各大评测视频中运行苹果自家的FCPX和达芬奇,采用M芯片的Mac相比英特尔处理器的Mac在效率上的提升才会如此惊人。
这就好比一个各科优秀的中学生某些特长特别突出,强于全面发展的名校大学生,甚至还吊打某些大学生学渣,引起用户惊叹,这很正常。
但前提是,苹果砸下重金,为这个特长中学生提供了普通家庭无法承担的成长环境,所以才能造就一个天才诞生。
其实光看晶体管数量就能发现,几乎5倍于i9-13900K的晶体管数量加上5nm工艺,就是X86无法想象的豪华阵容。
可一旦将擂台换到其他领域,那么这个特长中学生就失去了原有优势,例如重度生产力方面M系列芯片面对X86架构就毫无优势,就比如众生平等的AE渲染,M系列芯片的优势在X86面前就荡然无存。
那为什么X86架构处理器不采用和苹果类似的策略来提升性能呢?
因为兼容性,X86平台的用户可以根据自己的需求采购硬件组装机器,并且得益于X86架构强大的兼容性,用户现在都还能运行上世纪发售的一些游戏,而苹果A系处理器甚至是连10年前的应用都已经无法运行。
兼容性,恰恰也是Arm架构芯片最大的劣势,却是X86架构最大的优势,英特尔的通用核心相比苹果M系列芯片能够应对更多复杂场景。
而苹果M系列芯片虽然通过砸钱以及讨巧的设计,在部分场景中的发挥让人刮目相看,但是从宏观角度来看,更加深层的性能需求,Arm架构无法提供强大性能。
苹果M系列芯片能够成功,除去硬件方面愿意砸钱,苹果在iPhone以及iPad上对于Arm架构软件和生态以及系统的深耕优化已经超过十年。
所以M系列芯片能够取得今日的成绩,不是一朝而至的结果,而是苹果十年磨一剑,依托Arm架构本身的特性,再结合自己强大的硬件研发实力加上已经成熟的软件生态,才衬托出了M系列芯片的强大。
同时苹果的M系列芯片并不会对外出售,没有繁杂的硬件规格,也就不会出现兼容问题,况且手中还握有系统大权,深度的软硬件结合可以最大程度发挥M系列芯片的性能,并且维持在极低功耗下,这是苹果与Arm架构相辅相成的结果。
早在多年以前微软就曾试水过Suraface RT,采用Arm架构处理器,毫不意外地无人问津,生态缺乏加上Arm架构硬件与软件的结合并没有那么紧密,导致这款设备没有泛起一点水花。
所以Arm架构的M系列芯片确实在能耗以及发热方面有着巨大优势,但牺牲的却是强大的兼容性以及其他方面的性能。
而X86架构处理器充分发挥“大而全”的优势,通用核心能够应对所有工作需求,虽然这会带来极高的功耗。可是面对更加复杂的专业需求时,功耗还会是用户首要考虑的因素吗?问题的答案自然就一目了然。