来源:雷科技数码 3C 组 | 编辑:TSknight | 排版:LIN


(相关资料图)

去年 3 月份,英特尔在更换了新的 CEO 后,除了加大力度推进各个现有领域的研究计划外,还将投资的目光看向了固有市场之外的领域,比如正在悄然崛起的 RISC-V。

RISC-V 对于多数人而言或许都是一个陌生的名词,但是在半导体领域,这个架构正在吸引越来越多的投资和关注,在国内,RISC-V 被认为将会是我们弯道超车的机会,如阿里、华为等国内科技巨头都在押注该架构。

实际上,RISC-V 已经成为继 x86 和 ARM 之后的第三大架构,在全球市场占有一定的份额,当然,如果计算具体的份额占比,那么 RISC-V 距离 x86 和 ARM 还有一段相当遥远的距离。RISC-V 的前身 RISC,是曾经一度与 CISC(x86)并驾齐驱,甚至在服务器等领域的占比还超过了 CISC。

图源:wiki

后来的故事大家都已经知道了,在与 CISC 的战争中,RISC 最后成为落败的一方,市场被 x86 完全占领,随后整个 RISC 阵营近乎土崩瓦解,不少公司都开始转投其他市场和架构。但是,仍然有人没能忘记 RISC,经过多年的整合与调整,被命名为 RISC-V 的第五代 RISC 架构正式发布,以此为基础,一个全新的 RISC 联盟成立,华为等企业目前都是该行业联盟的高级会员。

在 RISC 联盟的高级会员名单中,英特尔的名字显然是最显眼的,作为曾经以一己之力击败 RISC 阵营的公司,英特尔主动加入这个联盟总有一种 " 黄鼠狼给鸡拜年 " 的感觉。不过,现在看来英特尔并非来搅局的,他们对于 RISC-V 架构有着自己的独特认知,并且正在将这个架构应用到自己的新产品线中。

图源:RISC-V

" 最了解你的,往往是你的敌人 ",作为 RISC 架构曾经以及未来的最大对手,英特尔对 RISC 架构的研究其实一直没有暂停,所以也让他们有着更多的资本来融入这个新的联盟。在去年 3 月宣布投资 10 亿美元进行 RISC-V 架构的处理器研发后,经过一年半的时间,英特尔正式向外界公布了自己的成果—— Piuma。

Piuma 是一颗特殊的芯片,特殊在于它虽然只有 8 个核心,但是却有 528 个线程,单核拥有 66 个线程,可以说在 Piuma 面前,单论多线程性能所有的 x86 芯片都要自愧不如。令人惊讶的线程数背后,还有更恐怖的互联性能,基于特殊设计打造的光学互联芯片,可以让最多 131072 个 Piuma 芯片互连,组成一个拥有 1680 万个核心,1.384 亿个线程和 512PB 共享内存的庞然大物。图源:intel

在这个规模的处理器阵列面前,传统的 x86 架构服务器多少有点不够看,在英特尔设计人员的计划里,Piuma 能够以传统处理器百倍的速度处理图形分析工作。

不过,Piuma 并非一个很新颖的概念,类似的产品此前也诞生过,那么 Piuma 的特殊之处在哪里呢?特殊在英特尔联合另一家公司,为其打造了一个特殊的光纤互联系统。

图源:intel

在光纤的帮助下,Piuma 的互联带宽高达 1TB/s,使其能够快速传输数据,而且相较于传统的铜线连接,光纤的延迟要低很多,使得大规模处理器阵列的搭建变得更加轻松。

或许大家都会好奇,传统的 x86 处理器往往只能做到单核双线程,Piuma 是如何做到一核六十六线程的?又是如何在获得充足的多线程性能同时保持一定单线程处理能力的?

据英特尔介绍,Piuma 芯片内设计有六个数据管道,其中四个中内置了 16 个线程,用于处理零散且多的数据,此外还有两条管道则是单线程设计,线程性能是多线程管道中单条线程的八倍。

图源:intel

有点类似于如今主流 x86 处理器所采用的大小核设计,只不过两者的顺序有所调换,多线程管道低主频但是多并发,主要负责处理零散任务,当遇到需要更多性能去处理,或是任务集群执行到最后一个任务线程时,处理器会将任务转交给单线程管道,腾出多线程管道空间运行下一个任务。

如此一来就能最大限度地利用各个线程,同时处理大量的零散数据,在遇到偶然的大体量任务时,则可以由高性能的单线程管道进行处理,避免其长时间占用多线程管道。

同时,Piuma 的八个内核都有独立的定制 DDR5 内存控制器,加上精简指令集的帮助,可以让单个最低访问粒度为 8 字节,远小于普通 x86 处理器的 72 字节,意味着 Piuma 可以更精准的调整内存占用,使得单核超线程的性能不会受制于内存调用。

传统的 x86 架构处理器面对这些低负荷却繁多的任务需求,往往难以发挥出单个线程全部的性能,100% 的性能却只发挥出 10% 甚至更少,而且还无法同时对多个任务进行处理,导致性能大幅度空置。

x86 架构的优劣势就是如此,虽然该架构可以打造出目前半导体市场中单线程性能最强的处理器,但是面对多而小的任务时,疲弱的多线程设计往往让 x86 架构处理器无所适从。在这个方面,ARM 的表现都远优于 x86,随着图形分析等小体量却多次数的任务需求增加,x86 架构已经难以应对这些繁复的工作。

但是,x86 所不擅长的工作,却恰好是 RISC-V 的强项,作为一个更精简、高效且开放的架构,RISC-V 的设计师可以轻松进行针对性修改,只需要遵循基础的指令集,就可以在此基础上打造出专属的处理器。

简单打个比喻,如果你想打造一辆车,要求是在直线跑道里跑得足够快,x86 却依然要求你留下诸如刹车、方向盘、转向装置等各种普通汽车该有的结构。而在 RISC-V 里,你可以将两个轮子装在一个火箭发动机上,然后宣布这就是你的新车,它或许无法处理多样化的任务,但是却能够跑出最高的直线速度。

RISC-V 的优势在于其不同于 x86 的指令集逻辑,RISC-V 可以更高效地处理小体量但多次数的重复任务,通过更精确的任务分配,让每个线程都发挥出最大的性能,同时利用指令集特性快速分配任务线程,提高整个系统的运行效率。

图源:intel

正是基于这个特性,Piuma 才能够做到八核五百二十八线程的超级多线程设计,虽然单线程的处理性能远低于 x86 架构处理器,但是却可以满足多并发的任务需求。随着人工智能等市场需求的增长,阿里的平头哥等企业都在基于 RISC-V 架构打造对应的多并发处理器,如今已经活跃于各个领域。

随着 ChatGPT 等 AI 大模型成为主流趋势,以 RISC-V 架构打造的处理器更符合 AI 大模型的实际运行场景,大量的短字节文字信息在常规的数据中心里处理会浪费大量的算力,而在以 RISC-V 处理器为核心搭建的数据中心里,短字节数据可以被精准分配到各个线程中处理,显著提升处理效率。

不过,想要打造出英特尔计划中的超大处理器集群,还有许多问题需要解决,目前英特尔的 Piuma 芯片在实际使用时,光纤的带宽只有理论带宽的一半,而且因为光纤发热问题,导致在实际使用中故障频发,需要经常检查和更换光纤连接线,以至于英特尔目前最多也只是将两颗 Piuma 芯片进行连接而已。

图源:intel

可以说,在光纤材料的难题解决之前,英特尔设想的超大处理器集群都还只停留在 PPT 上,但是,如果可以解决材料问题,我们将可以创造出更契合 AI 大模型的服务器集群。

End

推荐内容