欢迎访问ic37.com |
会员登录 免费注册
发布采购

ARM能否在服务器领域取代x86?

日期:2022-4-13 (来源:互联网)

ARM的参与对于云服务器制造商来说是必不可少的,无论是通用计算的云原生处理器,还是推理训练的AI/ML加速器。亚马逊的AWS应该是第一家引进ARM服务器的云服务制造商。然而,随着高通收购NUVIA并准备继续努力使用ARM笔记本芯片,它也退出了服务器芯片业务,而Marvell收购后不久,Cavium停止了Thunder系列处理器的开发。

ARM在服务器市场的出现率越来越高。ARM参与一般计算的ADR5041AKSZ-R2云原生处理器和推理训练的AI/ML加速器是必不可少的,为云服务厂商提供了一个具有吸引力的高性价比可选方案。

然而,不能产生服务器级别的ARM处理器是一回事,至于云服务制造商是否使用它是另一回事。虽然ARM在服务器领域的频繁行动,近年来新产品不断公开发布,但从云服务制造商部署的例子来看,这些ARM服务器芯片早期占据x86的份额,特别是其可选数量和规模仍不如传统的x86服务器,可以与GPU.FPGA.NPU等异构例子进行比较。

坚持自主研发的亚马逊

亚马逊的AWS应该是第一家引入ARM服务器的云服务制造商。2015年收购Anapurnalabs,亚马逊走上了自主研发的道路。自2018年以来,已部署并公开了三代ARM处理器。但从Graviton到Graviton3,主频率的提升并不是特别明显,只是从2.3GHz提升到2.6GHz,性能提升相当可观。

相反,亚马逊提供的性能比较项目基本上确定了这个ARM处理器的应用范围,如NGINX.Node.JS.REDIS的性能提升,代表了网页服务器;x264.x265编码速度和AES-256加密速度的提高代表了媒体服务器和加密应用;至于机器学习的改进,CPU可能仍然适合一些推理工作,但整体竞争力不如通用GPU。

微软坎坷的ARM路

Azure对微软来说更为复杂,过去微软业务的ARM生态系统与高通公司有着深刻的联系。更不用说服务器了,微软ARM坑,比如高通的SQ系列处理器,因为性能瓶颈被用户诟病。

2017年,微软宣布了奥林匹斯计划,包括两款ARM芯片:CaviumThunderX2和高通Centriq2400。然而,随着高通收购NUVIA,准备继续推广ARM笔记本芯片,但也退出了服务器芯片业务,而Cavium在被Marvel收购后不久就停止了Thunder系列处理器的开发。

面对这样一个洞,微软似乎已经下定决心自己填补。2020年底,微软自主研发ARM服务器芯片的消息传来。对于利润高的云服务业务,自主研发的处理器必然会再次降低成本。然而,自主研发芯片的正式发布还没有出现,反而迎来了Azure使用AmpereARM处理器的消息。

微软近日宣布,推出基于AmperealtraARM处理器的通用实例Dpsv5和内存优化实例Epsv5,最高频率为3.0GHz,最多提供64vCPU选项。微软表示,与x86类似实例相比,ARM实例的性价比提高了50%。

阿里的多管齐下

要说使用Ampere的ARM处理器,其实国内的阿里云更先一步。早在去年,阿里云就开启了AmpereARM服务器的测试应用。阿里云上的ARM服务器实例包括G6R和计算C6R,都配备了AmpereAltra处理器。前者选择1:4的处理器与内存匹配,后者选择1:2,但两者都是基于阿里云自己的第三代神龙架构,最多可选64vCPU版本。

根据阿里云官网给出的数据,g6r和c6r处理器的主频率为2.8GHz。与Ampere的官方数据进行比较后,可以得出阿里云使用的是Q80-28Amperealtra处理器,TDP为185W,属于80核Amperealtra主频第三版,但阿里云最高只提供64vCPU的选项。Amperealtra最高规格的一版频率可达3.3GHz,与阿里云主要g7实例中使用的英特尔Xeonplatinum8369BPl3.5GHz的瑞频率几乎相同。正如我们前面提到的,ARM处理器的优势在于成本。与英特尔x86实例相比,Amperealtra的ARM实例价格低了30%。

我们不能忘记阿里去年发布的益天710芯片。基于ARMv9架构的ARM芯片最多支持128核,显然是高性能计算。然而,该处理器尚未正式部署在公共实例中。考虑到益天710基于5nm工艺,很可能是由于产能问题。

ARM服务器仍被视为高性价比的选择

从各大云服务厂商的部署来看,ARM服务器仍被视为降低成本和能耗的解决方案,主要集中在一般计算上,目前无法抢占x86高性能计算的市场。目前,ARM服务器大多用于网页服务器、应用服务器、中小型数据库、游戏服务器、媒体服务器等计算压力低的场景,而数据分析、批量计算等计算负荷高的应用仍是x86的世界。

此外,虽然ARM服务器处理器无缝支持虚拟化,但缺乏x86处理器的多线程特性,VCPU对应于一个核心。Amperealtra之所以有这么多不同核心配置不同频率的SKU,是因为有些ARM处理器没有动态频率电路,所以相应的频率是最大的静态时钟频率,没有英特尔瑞频那样的动态频率功能。

不仅如此,目前的ARM服务器芯片玩家并不多,只有Ampere才能吃到各种云服务提供商的订单。相反,更多的是自主研发和自用的。比如亚马逊的Graviton和阿里巴巴的益天710都服务于自己的云业务,而英伟达的ARM服务器处理器还有一段时间。由此可见,在这个市场做第三方供应商确实很难,否则Marvell和高通不会陆续退出。

产能也在逐渐影响部署速度。亚马逊的Graviton3去年11月公布,但至今尚未投入部署;Ampere已经发布了最高128核的Altramax产品,但阿里云和刚刚发布的Azure仍然使用Altra。再加上上面提到的益天710,ARM还有很长的路要走。