原标题:百度造芯:AI处理器量产2万片背后,构建生态是重点
2021开年伊始,国内互联网巨头的造芯“战火”在春节序曲的余韵中持续绵延。作为国内互联网造芯“热门选手”之一的百度,在2月份市值创下新高、首次突破千亿美元,同时其芯片业务将在新一年中迎来新进展。
据百度今天发布的2020年第四季度财报,为进一步增强百度智能云的算力优势,百度自主研发的百度昆仑2芯片即将量产,并将部署在搜索、工业互联网、智能交通等业务领域。
此前,百度首款通用AI处理器百度昆仑1已于2020年实现2万片规模的部署。据称,相比百度昆仑1,百度昆仑2性能将实现3倍的提升。
目前,国内各大互联网厂商已在造芯赛道上集齐。除了百度以外,阿里巴巴旗下半导体公司平头哥在2019年发布了云端AI推理芯片含光800;腾讯在2020年成立了深圳宝安湾腾讯云计算有限公司,其业务范围涵盖集成电路设计和研发……
各大互联网厂商纷纷布局芯片背后,它们在芯片设计方面拥有怎样的优势?在国内几大互联网造芯“选手”中,已经实现自研芯片规模部署的百度,秉承着怎样的商业和技术思路?又将在未来推出怎样的芯片产品?
为回答这些问题,智东西挖掘互联网造芯背后的机遇与挑战,并解读百度自研芯片背后的商业、技术逻辑。
一、AI应用“倒逼”芯片功能进化,算力成互联网厂商新需求
回顾各大互联网厂商造芯之路,既面临着前所未有的机遇,也面临着极大挑战。
一方面,各大互联网厂商积极布局芯片设计市场背后,是智能化浪潮之下,新的市场需求涌现出来,互联网厂商相比传统芯片厂商具备了独特优势。
回顾传统芯片市场,几十年来,传统芯片厂商深耕硬件,沿袭低功耗、高算力的思路,依赖制程节点向物理极限逼近来保证产品竞争力。基于这一思路以及芯片设计能力,英特尔、Arm已分别雄踞多年传统的PC、手机市场多年。
但是,新一轮智能化浪潮不仅对硬件提出高要求,还要求软件算法做到极致。因此,AI芯片需要在软件、硬件两方面均达到要求,这为芯片市场带来了新的机遇。
从下游应用市场来看,近些年来,智慧能源、智能制造、智慧政务、智能交通、智能家居等领域逐渐兴起。而互联网厂商已在数据积累、算法成熟度、市场渗透能力方面做到了领先,占据了推动智能化变革的先机。
从AI发展本身的需求来看,AI的三要素是算力、算法和数据。传统互联网厂商在算法和数据方面具备天然优势,想要引领和推动智能化变革,补全算力短板可以说是其必然选择。
另一方面,互联网厂商造芯是一条“前无古人”之路,入局的玩家同样面临着挑战。
一位业内人士告诉智东西,在芯片产品设计过程中,互联网厂商面临的挑战主要来自于商业和技术两方面:
在商业方面,自动驾驶、HPC、通用计算等等各方面应用都具备着良好的前景,但这些应用的落地势必需要很长时间。玩家能否脚踏实地、一个步骤一个步骤地去实现目标,这是一个很大的挑战。另外,在每个领域中,都有不止一个玩家在布局,“强敌环伺”同样是挑战。
从技术角度来说,互联网造芯要回到芯片行业本身的规律,“把芯片产品做好”这个目标本身,对互联网厂商的技术能力提出了要求。这位业内人士称:“我们也看到,有一些互联网厂商造芯,背后得到了公司的支持,也拥有良好的应用场景,但最终并没有实现很好的落地。”
二、百度造芯背后:10年磨一剑,要打造软硬兼备的开放生态
目前,百度的自研芯片在产品成熟度方面已经取得了一些成绩。
2020年,百度自研的首款通用AI处理器百度昆仑1实现2万片的规模部署。与国内其他互联网造芯玩家的产品相比,百度昆仑1的出货量较为领先。
智东西了解到,相比国内其他互联网厂商,百度在自研芯片这条路上占据着先发优势。早在10年前的2010年,百度就开始采用FPGA自研AI芯片。10年前,放眼全球互联网行业,只有百度和Google TPU团队在那时就开始部署芯片研发。
同时,百度在通用芯片上摸索出了一套自己的“生态打法”——采用软硬一体化的发展战略。具体来说,相比传统芯片厂商,百度更注重性能、性价比和生态。
百度昆仑作为百度⼈工智能平台的核⼼组件,原生⽀持国内生态最领先的开源深度学习框架飞桨(PaddlePaddle)、百度机器学习平台(BML)及各垂类的AI能力引擎。百度昆仑不仅⽀持全球主流CPU、操作系统、Pytorch和TensorFlow等深度学校框架,还支持飞腾、申威、海光等国产CPU,麒麟、深度、统信等国产操作系统。
不同于传统的芯片企业靠卖芯片赚钱,也不同于传统的互联网企业通过卖服务挣钱,百度选择承担起“赋能”的角色。智东西了解到,百度芯片业务致力于与服务器⼚商一道,为新基建的智能化发展注⼊强劲动⼒。
按照这一设想,软硬一体化的AI芯片生态一旦建立,百度将实现从芯片到终端、应用、云端、服务的生态闭环,创造更大的商业价值。
三、百度昆仑:基于自研XPU架构,百度昆仑2性能再提三倍
百度昆仑1通用AI处理器于2019年成功流片,2020年成功量产。目前,百度昆仑1广泛部署于百度搜索引擎和百度智能云生态伙伴等场景。
百度昆仑1基于百度自研的昆仑XPU架构,采用三星14nm工艺、16GB HBM先进内存和2.5D封装解决方案,提供高达512GB/s的内存带宽。在低于150W的功率下,百度昆仑1可实现256TOPS的INT8处理能⼒。
作为一款通用AI处理器,百度昆仑1可⽤做推理和常规训练,在计算机视觉、语⾳识别、⾃然语言处理和推荐等算法上的性能指标高效且稳定。
软件方面,百度昆仑SDK软件开发包为开发者提供高效、灵活的编程接口和算法示例。开发者可以轻松利用工具识别和转换已有算法,⾃主结合处理器的硬件特性进行编译和优化AI计算任务。针对特定领域,⽤户还可以开发自定义算子以提⾼系统效率。
据百度方面分享,百度昆仑芯片具备高性能、低成本、高灵活性、自主可控的的特点,亦可描述为通用、易编程、高性能、自主可控。
具体而言,通用性是指百度昆仑芯片可支持全部的AI应用和场景;易编程指的是用户可借助百度昆仑芯片构建强大的软件生态护城河;高性能是指百度昆仑芯片可以支撑AI应用实现新可能;自主可控则是指在降低使用成本的同时,百度昆仑芯片也成为中国缓解技术被“卡脖子”问题的一道曙光,为构建国产化产业链贡献力量。
2021年上半年,百度第二款通用AI处理器百度昆仑2将实现量产,百度昆仑2采用7nm工艺。据称,相比百度昆仑1,百度昆仑2性能有望实现3倍的提升。
结语:互联网造芯未来可期
智能化浪潮奔涌而来,数据、算法、算力三大要素成为智能化市场玩家追逐的重要能力,亦为早有数据量积累的互联网玩家开启一扇“造芯”的大门。
互联网厂商作为芯片产业链中的“后来者”,虽然在建立商业闭环、培育产品生态、提升技术能力等方面仍有待耕耘和探索,但同样面临巨大的市场机遇,未来可期。
面对造芯之路上的种种挑战,百度选择通过建立软硬件一体的开放芯片生态、赋能全产业链的方式来“破局”。
可以看到,百度昆仑1已经实现了一定规模的落地部署。未来,百度还将通过怎样的产品来加强和完善其芯片产品布局?我们将持续关注。