本报记者 李玉洋 李正豪 上海报道
芯片封装环节的“双芯叠加”技术最近备受业界关注。
引爆点是苹果公司在3月9日凌晨推出的用于PC的M1 Ultral芯片,该芯片号称是有史以来最强悍的芯片,但该芯片实现性能提升的途径不是制造工艺的提升,而是在封装环节将两个M1 Max通过内部互连而成。事实上,在M1 Ultral推出之前,一家叫做Graphcore的英国AI公司,也推出了新款AI处理器Bow IPU。这两款新品采用同一种封装技术——3D Wafer-on-Wafer提升性能,这项技术来自于中国台湾的台积电。
事实上,华为海思去年也曾经被爆出“双芯叠加技术”专利,通过芯片叠加并经过系列优化,让14纳米芯片可以比肩7纳米芯片的性能水平。“X86双雄”英特尔和AMD也曾经推出过类似的产品,但当时存在功耗和发热等方面的缺陷。而苹果M1 Ultral的推出并商用,似乎意味着通过“芯片叠加”在封装环节大幅提升芯片性能的技术已趋成熟。
“晶圆工艺和封装工艺协同结合,是必然趋势。”半导体研究机构芯谋研究的研究总监王笑龙这样告诉《中国经营报》记者,“7纳米已经很先进,而3D封装也是提升这个产品综合指标的一个重要手段。”
而接受记者采访的多位业内分析人士均指出,随着芯片制造工艺越来越逼近物理极限,摩尔定律逐渐失效,依靠更先进的工艺来提升芯片性能将变得越来越困难,而3D等先进封装技术对延续摩尔定律愈发重要。
“这个(Bow IPU)证明了先进封装可以为性能带来可观提升,先进封装技术,是大家探索超越摩尔定律的路径之一。”Graphcore大中华区总裁兼全球首席营收官卢涛表示。
先进封装对芯片性能带来可观提升
作为全球第一款3D封装的处理器,Bow IPU采用了台积电SoIC-WoW技术,该技术以类似于3D NAND闪存多层堆叠那样,将两层die(裸片)以镜像方式垂直堆叠起来,以更先进的封装技术提升芯片性能。
需要指出的是,这是一种用于硅晶圆的3D堆叠形式,使得单个封装芯片中的晶体管数突破了600亿个大关。此外,Bow IPU的理论AI算力也从250 TeraFLOPS(每秒万亿次浮点运算)提升到了350 TeraFLOPS。据Graphcore介绍,总体而言,第三代IPU相对于上一代性能提高40%,能耗比实现了16%的提升。
事实上,Bow IPU的堆叠并不算特别复杂,主要负责计算、存储的IPU die位于下层,上方的die则主要为供电、节能等方面的功能提供帮助。卢涛曾这样介绍Bow IPU的die设计:“这是个大小die的设计,大die是计算die,小die主要做电源、能耗等方面相关的管理。”
卢涛表示,Bow IPU整体性能提升一方面来自新增的die,另一方面则得益于3D封装技术。那么,Graphcore为何没有选用更先进的工艺而选择改变封装方式?
对此,卢涛进一步指出,上一代IPU已经有了594亿个晶体管,面积大概为823平方毫米,这可能是7纳米的单个die能生产的最精密芯片了。如果想再提升,不换工艺,就只能是换封装。
“在经过深入评估之后,Graphcore认为,选择更先进的工艺并不能像以前那样获得大幅度的性能提升。而从成本收益角度看,也不划算。于是,我们选择了3D Wafer-on-Wafer作为芯片性能提升新方法。正是得益于这个决定,使得我们新芯片即使面积稍有上升,但成本与上一代比较相近,最终让我们可以以不变的价格交付新芯片。”卢涛说。
对此,电子创新网CEO张国斌也持有类似观点。“现在摩尔定律放缓,再往先进工艺演进的话,成本投入太大,不是一般公司能承受的,所以大家就认为延续摩尔定律的一个方法就是往2.5D和3D封装的方向发展。”他指出,Bow IPU这个产品代表的不是一个小众趋势,反而是一种大趋势,就是芯片以后要提升性能,可能会走2.5D/3D这种封装形式。
张国斌表示,对于晶圆级封装技术,不只是英特尔、格芯、台积电、三星等大的晶圆厂在研究,包括日月光等一些芯片封装企业也在研究,这对推动芯片的性能提升非常有好处。
商业场景落地和社区建设伴生而行
公开资料显示,作为一家人工智能硬件初创公司,Graphcore于2016年正式成立,IPU是该公司主要的技术成果,也是向外界传播的概念,官网宣称IPU是一款专为AI计算而设计的全新处理器。
长期关注半导体/芯片行业发展的资深观察人士黄烨锋表示,在AI芯片领域,Graphcore是全球最知名、最有实力的那批AI公司中的一个,也是在中国市场投入比较大的初创企业。“这家公司做AI芯片相对较早,勉强说引领发展趋势也行。不过,AI芯片的发展方向现在逐渐明朗化,未来大家都会越做越像。”他说。
黄烨锋进一步指出,诸如较大的片上存储空间、高度并行计算能力、跨芯片通信机制、芯片具备弱可编程性等都是AI芯片未来发展的趋势,而Graphcore的IPU是较早且在近存计算上颇具代表性的一类兼具可编程性的AI芯片。
落地难,是AI行业的通病,虽然AI芯片一直在持续发展,但落地的速度比预期的慢。作为AI芯片行业的企业,未来Graphcore将如何进一步发展以及加速商业化,对于行业具有参考价值。
卢涛曾把现在的AI芯片公司分成七大类,第一类是在组建团队的,第二类是在宣讲理念的,第三类是有了芯片的,第四类是有了芯片给客户送测的,第五类是有落地的,第六类是有很多场景落地的,第七类是真正能够跟GPU(图形处理器)分市场份额的。
“Graphcore目前处在第五至第六的阶段。”卢涛表示,要达到第七类,Graphcore首先要做的是生态建设,二是持续耕耘开发者与研究者社区的建设,三是与用户和客户保持充分的沟通,建立紧密的联系。
他还表示:“生态建设是一个持续的、需要花力气、花时间、花精力、花巧劲的活儿,因为用户在选择一个平台的时候,一是会很关注新的平台能为自己带来什么价值,二是会特别关注迁移到新的平台所需要耗费的工作量。生态建设越完备、生态发展得越好,用户的迁移成本就会越低,也就是用户在迁移到IPU时遇到的潜在阻力也会更小。”
其实,Graphcore这一发展策略有着英伟达的影子。“当年GPU从专用的图形处理器发展到后来可实现CUDA编程和应用于AI之时,就是英伟达将更多注意力转向软件、工具,完善开发生态的过程。像IPU这样的AI处理器也必然经历这样的过程。”黄烨锋说,Graphcore现在的发展关键更在于生态构建与实实在在的场景落地上。
对于公司的商业化进程,卢涛曾表示:“我很早就和CEO(Nigel Toon)聊过,公司的第一优先级是有人用我们的产品;第二是有人用了这个产品,服务他的业务;第三是业绩;第四才是利润。现有顺序不能弄错,先得有人用你的东西,才能谈其他。”
如今,这样的顺序依旧没有变。“商业场景落地和社区建设是相互支持、伴生而行的。针对商业客户,我们需要开发者对平台的支持,开发者花费时间和精力将自己的业务迁移到IPU上,或基于IPU开发自己的业务。落地的场景越多,越能推进其他商业用户的跟进和加入,也能加快后续其他案例落地的速度。”卢涛告诉记者。
过去一年中,Graphcore与升哲科技、安捷中科、深势科技等公司围绕包括城市治理、气象以及分子动力学等领域开展合作,还与金山云推出了基于Graphcore IPU平台的服务器产品——金山云IPU服务器,用于AI任务在云端的训练和推理,这也是中国首个大型公有云厂商对外公开推出自己的IPU云产品。
“我们会持续深耕本地的合作伙伴,在一些相关的AI应用领域,会做进一步的加深合作,比如用AI辅助科研、自动驾驶等,都是我们2022年在AI应用和垂直领域中比较重要的方向。”卢涛说,持续落地更多应用场景是商业化唯一的路径,“这里没有捷径可以走。”