作者 | 心缘
编辑 | 漠影
作为阿里第一颗为云而生的CPU芯片,倚天710无疑是阿里云推进“一云多芯”策略的重要一步,将于阿里云数据中心部署应用,率先在今年双11应用,并逐步服务云上企业。
至此,阿里成为继亚马逊、华为后,全球第三家拥有自研Arm服务器芯片的云计算厂商。
除了进军服务器芯片外,阿里平头哥还宣布玄铁CPU已出货超25亿颗,成为国内应用规模最大的国产CPU,并宣布开源其玄铁RISC-V系列处理器,开放相关工具及系统软件。
一、业界首款5nm服务器芯片:128核、600亿晶体管
阿里云智能总裁、达摩院院长张建锋说,基于阿里云“一云多芯”和“做深基础”的商业策略,平头哥发布倚天710,以满足客户多样性的计算需求。
这款CPU针对云场景的高并发、高性能和高能效需求而设计,将领先的芯片设计技术与云场景的独特需求相结合,基于最新ARMv9架构,内含128核CPU,主频最高达到3.2GHz,能同时兼顾性能和能效比。
这也是业界第一颗采用5nm工艺的服务器芯片,单芯片容纳高达600亿个晶体管。
由于5nm工艺对能量密度、芯片内部结构的布局要求极高,平头哥在研发过程中灵活调度多达30种不同EDA软件、深度定制时钟网络和定制IP技术,并采用了先进的多芯片堆叠技术,以确保芯片性能、功耗的优化。
在内存和接口方面,倚天710集成了业界先进的DDR5、PCIE5.0等技术,可有效提升芯片的传输速率,并适配云的不同应用场景。
为了解决云计算高并发条件下的带宽瓶颈,倚天710针对片上互联进行了特殊优化设计,通过全新的流控算法,有效缓解系统拥塞,从而提升了系统效率和扩展性。
在全球权威CPU基准测试集SPECint2017上,倚天710的分数达到440,超出业界标杆20%,能效比优于业界标杆50%以上,能有效帮助数据中心节能减排。
张建锋说,阿里在全球管理着超过150万台服务器。而成功自研云端芯片,不仅有助于降低阿里巴巴集团内部整体计算的成本,还能通过阿里云向外输出,带给云上客户更高性价比的选择。
二、倚天710亮剑背后,Arm吹响冲锋号角
通用处理器芯片是数据中心最复杂的芯片之一,其架构设计之复杂、技术难度之高,致使多年以来,掌握这一技术实力的企业屈指可数。
全球三大指令集架构中,x86俨然是服务器芯片市场的主宰者,x86霸主英特尔长期占据主导地位,另一位x86核心玩家AMD亦在近年异军突起。
但过去三年间,市场格局开始发生变动——Arm向服务器市场吹起了冲锋的号角。
2018年10月,Arm宣布将推出一款专为云数据中心、边缘计算及5G网络市场而打造的全新品牌——Neoverse系列服务器处理器,并逐步完善V、N、E三大系列产品路线图。
日益增长的Arm服务器处理器IP核性能,递给了云计算厂商有力的造芯武器。
2018年11月,全球第一大云服务商亚马逊AWS推出基于Arm架构的首款AWS Graviton服务器芯片;2019年1月,华为推出基于Arm架构的7nm 64核服务器芯片鲲鹏920;2019年12月,亚马逊AWS推出采用Arm Neoverse N1内核的7nm第二代Graviton服务器芯片。
独立服务器芯片供应商也抓住这一机遇。2018年成立的安晟培半导体(Ampere Computing)在2020年6月公布业界首款拥有128核CPU的Arm服务器芯片Ampere Altra Max。在国内,飞腾已基于Arm架构研发多代服务器芯片。
尽管倚天710“出鞘”稍晚,但无论是业界首发5nm还是创新架构设计,都展现了平头哥研发设计大型复杂芯片的能力。按照公开信息,Ampere和飞腾均计划在明年上新5nm服务器芯片。
与其他自研芯片的云厂商类似,倚天710不会出售,主要是阿里云自用。
阿里云已全面兼容x86、Arm、RISC-V等主流芯片架构,自研倚天710进一步丰富了阿里云的底层技术架构,并与飞天操作系统深度协同,为云上客户提供高性价比的云服务。
阿里云智能总裁、达摩院院长张建锋表示:“我们将继续与英特尔、英伟达、AMD、Arm等合作伙伴保持密切合作,为客户提供更多选择。”
对于阿里云自身而言,倚天710的问世,意味着从底层芯片、云操作系统到存储、网络、数据库系统,阿里云已经实现全栈自研。
三、“一云多芯”策略加持,阿里持续扩张芯版图
在业界,阿里自研芯片早已不算新鲜事。
自2016年11月投资软件定义网络(SDN)芯片公司Barefoot起,阿里便开始展露布局芯片的雄心,陆续投资翱捷科技、寒武纪、深鉴、耐能、中天微、恒玄科技等芯片公司,覆盖AI芯片、物联网芯片等多领域。
2017年10月,阿里成立达摩院,随后迅速组建了一支由半导体行业工业界和学术界顶级专家组成的技术团队,开始专攻核心芯片设计技术。
2018年,阿里巴巴全资收购大陆唯一拥有自主嵌入式CPU IP核的半导体公司中天微,并在数月后将达摩院芯片研发团队与中天微团队合并成立平头哥半导体公司。
三年之间,平头哥完成了从发布首款RISC-V处理器玄铁710、首款云端AI推理芯片含光800到首款通用服务器芯片倚天710的“三级跳”。
而此前积累的AI芯片及处理器IP设计经验,也成为平头哥突破通用芯片研发技术的基础。
在处理器IP方面,平头哥累计开发了十多款基于RISC-V架构的玄铁系列嵌入式CPU IP核,这些为AIoT终端芯片提供的高性价比IP产品均已得到大规模量产的验证,覆盖从低功耗到高性能的等机器视觉、工业控制、车载终端、移动通信、多媒体和无线接入各类场景,累计出货量超过25亿颗,拥有150余家客户、超500个授权数,已成为国内应用规模最大的国产CPU。
继发布玄铁710等处理器后,平头哥今日宣布其在RISC-V生态上又一重要举措——开源四款玄铁RISC-V系列处理器,覆盖高、中、低应用场景,并开放相关工具及系统软件。全球开发者可通过平头哥Github和芯片开放社区下载玄铁源代码,平头哥也将持续开源稳定的、全栈一体的RISC-V IP核,并提供技术支持和应用服务。
这是系列处理器与基础软件的全球首次全栈开源,将进一步拉近了RISC-V技术与开发者的距离,加速生态进步和创新落地。
在云端芯片方面,背靠全球前三、亚洲第一的云平台阿里云,平头哥在深刻理解数据中心业务场景和需求方面具备天然优势。阿里第一颗云端AI推理芯片含光800已实现规模化应用,通过阿里云服务了搜索推荐、视频直播等行业客户。
达摩院、平头哥及阿里云正成为阿里巴巴三位一体的核心技术栈。随着倚天710的发布,平头哥已拥有处理器IP、AI芯片及通用芯片等产品家族,其端云一体化战略愈发清晰。
结语:云巨头造芯序幕拉开
打造高性价比的自研云端芯片,已是近年多家云计算巨头重点发力的方向。通过自研芯片,云服务商能结合自身场景需求,为客户提供更丰富的选择,以及更高性价比的软硬件协同方案。
与此同时,基于Arm架构的服务器芯片在技术、性能、生态系统方面都日益成熟,这给云厂商自研芯片提供了便利的土壤。
随着Arm的士气一路猛涨,服务器芯片格局逐渐趋于多元化。而以亚马逊AWS、阿里云为代表的云厂商们,正通过不断汇聚优质芯片设计人才及技术资源,成为Arm服务器扩张疆域的生力军。
本文来源:cnBeta 如有侵权请联系管理删除