财联社9月29日讯(编辑 唐叶天)当地时间9月30日,特斯拉的第二个AI Day即将在美国加州开启,其中最大的看点就是马斯克调用Autopilot团队赶工的特斯拉机器人“擎天柱”原型机首次亮相。而除此之外,特斯拉还预告了“老本行”自动驾驶领域的新进展,包括最受关注的Dojo超级计算机。
图:特斯拉AI Day预告页面在2021年的AI Day上,特斯拉透露它正在构建Dojo超级计算机,其中每个节点都有自己的CPU、内存和通信接口。Dojo超级计算机的单个训练模块由25个D1芯片组成,D1是特斯拉自主研发的神经网络训练芯片,单芯片在BF16精度下算力高达362 TFLOPs,功耗却只有400W,兼具GPU级别的训练能力和CPU级别的可控性。D1理论上可以无限叠加为超级计算集群。
造汽车的特斯拉,为何要自研芯片?
自动驾驶是智能硬件和软件结合的科技尖端技术,为了实现最大协同,超级计算机Dojo(译为“道场”)应运而生,目的是“训练”特斯拉汽车。有海外科技博主表示,特斯拉的目标就是制造一款针对其大量视频AI需求进行自动驾驶优化的超级计算机。
如果说此前以纯视觉为基础的完全自动驾驶(FSD)芯片解决的是车端的问题,Dojo所解决的就是云端的深度学习、最终指向纯视觉基础的完全自动驾驶。来自全球超100万辆特斯拉车辆采集的真实数据汇聚在超级计算机上,进行深度机器学习,再反馈给神经学习系统,帮助特斯拉的Autopilot实现无限“进化”。
时间来到今年,在2022年8月底的Hot Chips 34 (HC34) 大会上,特斯拉已提前分享了Dojo超级计算机的全新面貌。特斯拉在大会上进行的两场演讲一场是关于Dojo的微架构,另一场是关于Dojo的System-on-Wafer解决方案。与会人员认为今年的AI Day上,关于Dojo的更多细节将公开。
英伟达的“重磅炸弹”Thor:算力较现行版本提升8倍
无独有偶,刚刚发布了40系显卡的英伟达,也在2022秋季GTC大会上抛出了“重磅炸弹”:自动驾驶芯片DRIVE Thor。
据黄仁勋介绍,这组被命名为“雷神”的超级计算机在算力上达到了2000 TOPS和2000 TFLOPs,只靠一个基于Thor芯片的系统,就能够运行自动驾驶、数字仪表盘/车机、车载信息娱乐一整套系统。据称,Thor的算力是上一代特斯拉FSD芯片的14倍。
同时,Drive Thor也是英伟达第一个具有Transformer引擎的自动驾驶汽车计算平台。Transformer引擎在“雷神”GPU单元的H100 Tensor Core中运行,能够极大提升车载算力的性能,降低了对云端服务器和连通性的要求。黄仁勋介绍,“车载计算资源的集中化可以将成本降低数百美元”。无疑,这是英伟达CPU、GPU、引擎技术协同的巅峰。
Thor的诞生,取代了英伟达DRIVE原本发展路线图中的Atlan,能够与目前被用于量产汽车、可提供每秒254万亿次浮点运算性能的DRIVE Orin无缝衔接。至于为什么用Thor取代Atlan,黄仁勋解释称:“因为出现了令人不可思议的Hopper、AdaGPU和Grace GPU,我们不愿意为此再等两年,于是决定用Thor取代Atlan,并集成了最新的技术,有了Thor超级芯片。”
目前国产新势力龙头蔚来、小鹏等公司的高端车型所搭载的,就是单颗算力为254TOPS的芯片Orin。而现在Thor的算力,较Orin提升了8倍。极氪成为了第一个宣布要搭载Thor的汽车品牌,约于2025年初开始生产。
自动驾驶芯片顶流争霸,国产新秀纷纷崭露头角
这一行业中也不乏国产玩家。目前世界上主要自动驾驶芯片厂商除了特斯拉、英伟达,还包括Mobileye、高通等国外厂商和地平线、黑芝麻、华为等国内厂商。国产自动驾驶芯片已在崭露头角,华为2021年发布的昇腾 810算力高达400+Tops,黑芝麻将在今年内推出算力突破250+ Tops的A2000自动驾驶芯片。
申万宏源汽车团队表示,目前的“软件定义汽车”浪潮下,前装硬件算力需求增大,高算力芯片成为高级别自动驾驶车型主流选择。在汽车智能化过程中,高算力需求体现在以下三点:①从自动驾驶芯片来看,目前多种类摄像头、雷达等车载传感器搭载数量提升趋势明显,同时伴随未来自动驾驶级别攀升至L3及以上,芯片高算力会是核心需求。
但单纯的芯片算力并不能完全代表自动驾驶能力,也要考虑对算力调用的效率。因此申万宏源认为,以专业化架构+软硬结合的方式实现芯片的高实用性能或成为未来芯片厂商的主流方案。 同时未来的自动驾驶也需要更加开放,一家公司不可能独揽功能与算法的定义,行业需要更加合作,才能促使自动驾驶的落地。芯片行业产业链有望由垂直式链条走向“朋友圈”式更开放、更灵活的路径。
其还认为,面对未来的不确定性,还会需要芯片算力与功能的冗余,芯片算力的军备竞赛还会持续,尤其是在自动驾驶领域,自动驾驶的感知与执行器件需要为未来考虑。当下的“硬件预埋”也是这个道理。