相比国内的繁荣,欧美AI芯片的多数风头却被科技巨头占据,英伟达在云端训练市场风光无二,英特尔继续主导推理市场,率先闯进独角兽阵营的欧美AI芯片独角兽仅有6家。
AI芯片,这一互联网巨头们争相布局的硬科技领域,为何在国外市场没有掀起大量融资浪潮?我们从其核心团队、融资情况、发布产品等信息进行了梳理。
这6家独角兽集中成立于2016-2017年,分别是拿到Google、英特尔投资的SambaNova Systems,凭借全球最大晶圆级芯片爆红的Cerebras Systems,英国唯一AI芯片独角兽Graphcore,由GoogleTPU初始团队创立的Groq,芯片大神Jim Keller加盟的Tenstorrent以及以色列的AI芯片独角兽Hailo Technologies。
▲截止2012年12月欧美AI芯片六大独角兽公司融资、产品情况(以上整理自公开网络信息,如有错漏,欢迎沟通指正)
凭借领先的创新技术与落地进程,这6家欧美AI芯片独角兽代表,正将影响力辐射至全球科技圈。
一、SambaNova:甲骨文元老、斯坦福教授创立,获Google英特尔投资
6家独角兽中,SambaNova Systems估值最高,最新一轮融资总额也遥遥领先。
这家美国的AI芯片公司成立于2017年,总部位于美国加州帕洛阿尔托,2019年春季已发布第一款Cardinal云端训练芯片,落地于美国阿贡国家实验室、美国能源部旗下国家核安全管理局(NNSA)等多个研究机构。
值得一提的是,投资SambaNova Systems的投资方不仅包括活跃的投资机构日本软银、淡马锡等,还有Google、英特尔等知名科技巨头。
▲SambaNova Systems融资情况(以上整理自公开网络信息,如有错漏,欢迎沟通指正)
今年4月,该公司获得最新一轮6.76亿美元的D轮融资,融资后估值超过50亿美元,一举跃升欧美估值最高的AI芯片公司。
SambaNova Systems由曾在甲骨文任职的罗德里戈·梁(Rodrigo Liang)以及斯坦福大学教授昆勒·奥鲁克顿(Kunle Olukotun)、克里斯·雷(Chris Ré)联合创办。
▲SambaNova Systems创始人昆勒·奥鲁克顿(左)、罗德里戈·梁(中)、克里斯·雷(右)
其中奥鲁克顿是斯坦福大学芯片多处理器项目的负责人,雷是斯坦福大学计算机科学系副教授、麦克阿瑟天才奖的获得者,并在统计机器学习小组和斯坦福大学AI实验室开展研究工作。
2021年4月,SambaNova Systems推出了其第二代云端AI芯片可重构数据流单元Cardinal SN10 RDU,包含400亿晶体管,采用台积电7nm制程,由一系列可重构节点组成,用于数据存储和交换。每个Cardinal芯片有6个控制器用于内存,可实现153 GB/s的带宽,8个芯片以全配置连接。
▲SambaNova Systems第二代云端AI芯片Cardinal SN10 RDU
SambaNova Systems的AI芯片并不会单独出售,而是作为一种安装在数据中心上的解决方案配套出售。目前其SambaNova Systems的旗舰产品是订阅型的AI服务平台SambaNova DaaS,与其集成软件和硬件系统平台DataScale一起使用。
▲SambaNova Systems AI服务平台SambaNova DaaS
SambaNova Systems的AI芯片以及它的客户在很大程度上仍处于保密状态。其产品自2020年以来已进入美国能源部下属的劳伦斯·利弗莫尔国家实验室和阿贡国家实验室。SambaNova Systems主要是根据客户需求定制产品,并提供一套默认的网络和管理功能,并由SambaNova Systems进行远程管理。
二、Cerebras:打造全球最大芯片,今年解锁“人脑级”AI模型
2019年8月,美国硅谷创企Cerebras Systems推出的世界最大芯片引爆芯片圈。今年4月,这家公司推出了巨芯二代WSE-2,可处理超级计算任务,搭载WSE-2芯片的AI超算系统CS-2也同期发布。
这家以巨型芯片闻名的独角兽公司成立于2016年,总部位于美国加州洛斯阿尔托斯。就在今年11月10日,Cerebras Systems宣布,获得2.5亿美元F轮融资,总融资额达到7.5亿美元,投后估值超40亿美元。
▲Cerebras Systems融资情况(以上整理自公开网络信息,如有错漏,欢迎沟通指正)
Cerebras Systems由加里·劳特巴赫(Gary Lauterbach)和安德鲁·费尔德曼(Andrew Feldman)联合创立。
值得一提的是,加里和安德鲁曾经还联合创办了专注于超高密度计算机服务器业务的Seammicro公司,这家公司在2012年被AMD以高达3.57亿美元的价格收购。
▲Cerebras Systems创始人安德鲁·费尔德曼(Andrew Feldman)(左)和加里·劳特巴赫(Gary Lauterbach)
今年4月,Cerebras Systems又推出了巨芯二代Wafer Scale Engine 2(WSE-2),该芯片为超级计算任务而构建,具有破纪录的2.6万亿个晶体管和85万颗AI优化内核,大小类似餐盘,采用台积电的7nm工艺。
▲Cerebras第二代芯片WSE-2
今年8月,Cerebras Systems宣布推出世界上第一个人类大脑规模的AI解决方案,一台CS-2 AI计算机可支持超过120万亿参数规模的训练。相比之下,人类大脑大约有100万亿个突触。
此外,Cerebras Systems还实现了192台CS-2 AI计算机近乎线性的扩展,从而打造出包含高达1.63亿个核心的计算集群。
▲Cerebras Systems人脑规模AI解决方案的技术组合
目前,Cerebras Systems的AI超算系统CS-2只有少数客户可以使用,它的客户集中于军事、实验室等。Cerebras Systems重量级客户包括美国阿贡国家实验室、劳伦斯利弗莫尔国家实验室、匹兹堡超级计算中心、爱丁堡大学的超级计算中心、葛兰素史克、东京电子器件等。
三、Graphcore:英国唯一AI芯片独角兽,与阿里、百度建立合作
作为闯入中国AI芯片市场的少数国外独角兽之一,Graphcore已经与阿里巴巴、百度建立合作。该公司为阿里巴巴的HALO专门定制代码,并加入了百度的飞桨硬件生态联盟。
这家公司还是英国的唯一一家AI芯片独角兽。Graphcore成立于2016年,总部位于英国布里斯托尔。2020年7月,Graphcore推出第二代云端训练芯片GC200。
最新一轮融资后Graphcore估值达27.7亿美元,这使得它成为欧洲市值最高的芯片初创公司。
此前,Graphcore高级副总裁、中国区总经理卢涛在接受芯东西等媒体采访时谈道,当下Graphcore面临唯一的巨头挑战是英伟达。而Graphcore和英伟达的渊源不止于此,Graphcore的创始人Nigel Toon此前创立的芯片公司Icera,于2011年被英伟达收购。
▲Graphcore的联合创始人Nigel Toon(左)和Simon Knowles
Graphcore此前共经历了6轮融资,最新一轮融资在2020年12月29日公布,融资金额高达2.22亿美元,是6笔融资中金额最高的。Graphcore已经获得超过4.5亿美元的融资,战略投资者不乏宝马、博世、戴尔、微软、三星等各行业巨头。
▲Graphcore融资情况(以上整理自公开网络信息,如有错漏,欢迎沟通指正)
Graphcore的AI芯片为智能处理单元IPU,采用自研大规模并行同构多核架构,包含1216个独立IPU核心。
Graphcore研发的GC200芯片基于7nm工艺,最多可以连接64000个芯片来创建一个巨大的并行处理器,其计算能力约为16 exaFLOPS。这样的系统将能够支持具有数万亿个参数的AI模型。
基于第二代IPU芯片GC200,Graphcore还构造了大规模系统级产品IPU-M2000以及模块化机架规模解决方案IPU-POD系统。
Graphcore的IPU-POD系统可以将AI计算和服务器进行分解,以优化其解决方案为不同的AI工作负载提供最高性能。
▲Graphcore的大规模系统级产品IPU-M2000
值得注意的是,Graphcore也开始在中国市场大展拳脚。Toon曾在接受采访时说,中国是支持Graphcore AI计算应用增长最快的市场,并正式定名为“拟未科技”。Graphcore将与中国的生态联盟共同推广新的AI应用程序,并帮助建立行业标准。
在去年5月的Wave Summit 2020深度学习开发者峰会上,Graphcore宣布成为百度飞桨硬件生态圈共建计划伙伴之一,加速机器视觉、自然语言处理等算法模型与硬件的适配与落地。
四、Groq:主攻计算机视觉,前GoogleTPU团队创立
2016年底,GoogleTPU核心团队中乔纳森·罗斯(Jonathan Ross)悄悄离职,与同样出身Google的道格拉斯·怀特曼(Douglas Wightman)在美国加利福尼亚创立了一家机器学习系统公司。这家公司就是美国的独角兽AI芯片初创公司Groq,它成立于2017年,总部位于美国加州山景城。
最新一轮融资完成后,该公司估值已超10亿美元。
Google的TPU团队负责研发用于加速机器学习的定制芯片,曾帮助软件程序AlphaGo(阿尔法狗)击败传奇围棋玩家李世石。而Groq的创始团队中有8名都出身于Google的TPU核心团队。
▲Groq创始人乔纳森·罗斯
此前,Groq共经历4轮融资,2021年4月,Groq获得最新一笔融资,金额为3亿美元,由Tiger Global Management和亿万富翁Dan Sundheim投资。该公司前4轮融资总额仅为6230万美元,新一轮融资完成后,其融资总额达到3.623亿美元。
▲Groq融资情况(以上整理自公开网络信息,如有错漏,欢迎沟通指正)
2019年11月,Groq推出了张量流处理器TSP架构,该架构是世界上第一个能在单个芯片上每秒执行1000万亿次(1000 TOPS)操作的芯片架构,专门针对计算机视觉、机器学习和其他AI相关工作负载的性能需求而设计。
Groq的TSP架构受软件优先的启发,能够实现实现计算灵活性和大规模并行性。目前已经在x86和非x86系统的客户站点上运行。
同时期,Groq推出了其首个云端推理芯片GroqChip,可以实现16个芯片间互连和230 MB SRAM,灵活集成到嵌入式应用中,算力可达750 TOPS。
GroqChip还使用TSP架构,使其能够在内存中存储更多的模型,以高计算性能处理数据,这使得它非常适合从大型数据集进行推理。
除此之外,该公司坚持“以软件为先”,其编译器能处理硬件中的控制功能,例如执行计划等。Groq的软件还可精心编排所有数据流和所需时序,以确保计算不会出现停顿,并在编译时完全可预测延迟、性能和功耗。
▲Groq的产品架构
2020年,美国阿贡实验室的科学家们使用GroqChip创建了SARS-CoV-2病毒的机器学习模型。
第一代芯片发布后,Groq称正在研发第二代新型芯片,但截至现在,还没有检索到二代芯片的相关信息。
罗斯谈到,机器的学习效果是具有随机性的,想要他们正确应对各种复杂的情况是非常困难的,当随机情况发生的时候,需要完成所有可能的计算,才能达到机器学习的最优化,这使得执行起来的成本大大增加。而Groq的芯片构架就可以为机器学习和AI应用带来客观的性能提升。
五、Tenstorrent:兼顾高算力和可扩展,获芯片大神加盟
传奇芯片设计大神Jim Keller去年6月从英特尔辞职后,今年1月宣布加盟加拿大AI芯片创企Tenstorrent,担任CTO兼总裁。
手握本科学历的Jim Keller,人送外号“硅谷游侠”,1998年从业以来,20年间辗转于多家大型科技公司,不乏AMD、苹果、特斯拉、英特尔等顶尖企业,这位技术大牛不断革新半导体行业的发展,屡屡研发出里程碑式的芯片。
2020年6月,这位业界传奇人物从英特尔离职,他的去向备受业界关注。但出乎多数人的预期,这个答案在今年1月揭晓——Jim Keller选择加盟了一家AI芯片公司Tenstorrent。
之所以做出这样的选择,Jim Keller在接受外媒专访时予以回应:“目前爆发性增长的AI芯片领域,Tenstorrent更像是一张白纸。我在公司中拥有大量股权,公司CEO Ljubisa Bajic也是我的老朋友,无论是基于财务还是对朋友的承诺,我都会选择暂时待在这里。”
▲Jim Keller(左)和Tenstorrent创始人Ljubisa Bajic
Tenstorrent于2016年创立,总部位于加拿大多伦多市。最新一轮融资完成后,这家公司的估值达到了10亿美元的级别。2020年4月,Tenstorrent推出其第一款AI芯片Grayskull,可以兼顾AI训练和推理任务。
Tenstorrent此前共经历4轮融资,最新一轮融资在2021年5月20日,完成了超过2亿美元资金的C轮融资,由私募股权机构富达管理(Fidelity Management)领投。
▲Tenstorrent融资情况(以上整理自公开网络信息,如有错漏,欢迎沟通指正)
2020年4月7日,Tenstorrent发布其首款AI芯片Grayskull。同年年底,Grayskull开始量产,并逐渐向早期客户出样。
Grayskull处理器配备Tenstorrent定制的Tensix能够提供368 TOPS。每个Tensix核心具备完全C++可编程、多线程、前端功能;高面积和功率效率矩阵计算引擎;强大灵活的SIMD引擎等。
▲Tenstorrent推出的第一代AI芯片Grayskull
相较市面上现有AI芯片产品,Grayskull不仅能兼顾高算力和低能耗,还具备高度可扩展的特点,可扩展到10万个节点,支持从小型嵌入式设备到大型数据中心的AI推理和训练任务。
Tenstorrent的研究人员设计了一个能实现细粒度条件执行、动态稀疏处理的完全可编程体系结构,可将较大数据组的复杂计算任务分解成多个较小数据组的计算,由芯片上的各个内核进行独立的处理。
其研究人员称,该处理器新的架构方法将通过适应模型的确切输入并紧密集成计算和网络,使处理器能够随着AI模型的持续增长而扩展。
2021年6月,外媒SemiAnalysis报道,Tenstorrent正在研发的第二代AI芯片Wormhole,将更注重训练而不是加速,并捆绑在16×100 G以太网端口交换机中。
Jim Keller加盟后谈道,Tenstorrent的目标是将高性能的AI芯片与一种新方法相结合,利用AI来优化低级软件功能,通过这种被称为Software 2.0的方法来提高效率和运算速度。Jim Keller将为Software 2.0提供所需的硬件解决方案。
六、Hailo:以色列独角兽,中国资本参投
以色列AI芯片独角兽Hailo Technologies成立于2017年,总部位于特拉维夫,主打为边缘设备提供数据中心性能。以色列国防军以黑科技著称,是以色列科技界的中坚力量,Hailo Technologies的创始人奥尔·达农(Orr Danon)就来自以色列国防军精英技术小组。
▲Hailo Technologies的创始人奥尔·达农
今年完成最新一轮融资后,Hailo Technologies的总估值约为10亿美元,正式晋升独角兽企业。
此前,有中国投资公司上海耀途资本参投,这家投资公司聚焦物联网、大数据、云计算及AI领域。
该公司共经历4轮融资,最新的一轮是2021年10月12日,融资金额为1.36亿美元,其融资总额已经达到2.239亿美元。
▲Hailo Technologies融资情况(以上整理自公开网络信息,如有错漏,欢迎沟通指正)
目前Hailo已推出一款AI推理芯片Hailo-8及M.2和Mini PCIe加速模块,分别在2019年5月和2020年10月推出,AI推理芯片Hailo-8已经实现量产。
2019年5月,Hailo Technologies发布了超性能创新架构AI芯片Hailo-8,该芯片性能高达26 TOPS,并且具有超小的面积和功耗,芯片尺寸均小于1美分。
▲Hailo Technologies推出的AI芯片Hailo-8
Hailo Technologies的Hailo-8深度学习芯片可在边缘提供数据中心级芯片的性能,同时在尺寸、性能和功耗方面击败竞争的边缘处理器。
2020年10月,Hailo Technologies宣布推出基于Hailo-8芯片M.2和Mini PCIe高AI加速模块,该公司称已经与富士康展开合作,将M.2模块整合到其 “BOXiedge”边缘计算平台中。
IBM、英特尔、三星电子、阿里巴巴等跨国科技巨头已经在研发过程中注意到了该公司的技术,它们已经有部分技术引用了Hailo Technologies公司的专利。
今年10月,Hailo Technologies称正在努力将其芯片构建到原始设备制造商(OEMs)和一级汽车公司的产品中,这些领域包括先进的驾驶辅助系统以及机器人、医学、智慧城市和家庭等。
结语:AI芯片产品各异,创企如何突出重围?
经过四五年的磨砺,这6家欧美AI芯片独角兽的自研芯片产品已经开始走向落地。可以看到,多家的首批客户集中于大型实验室,商业化程度还相对有限,其中Graphcore已率先发力中国市场。
与此同时,系统化已经是今年AI芯片产业呈现的一大趋势。AI芯片独角兽在其自研芯片的基础上,已经陆续打造从板卡、服务器、软件到集群的更完整系统级解决方案,并公布更多的应用案例,来展现其技术实力和商用价值。
相比国内,欧美AI芯片创企面临的生存压力往往更甚,它们直面英伟达、英特尔等芯片巨头已经构筑的深厚生态壁垒,又缺少国产化替代等外部环境特定的激励,此前有些AI芯片创企已经被巨头企业收购,也曾有明星企业走向破产重组。
作为AI技术的底层驱动,AI芯片行业发展态势不可逆转,更多半导体大公司、互联网巨头和创业公司开始布局这一领域。而如何在一众强手中突出重围,将是AI芯片企业们面临的关键考验。
本文来源:cnBeta 如有侵权请联系管理删除