原标题:“华智冰”研发背后:未来智能产业规模或会超过互联网产业
中国首个原创AI虚拟学生“华智冰”诞生后很快走红,这名美丽而聪慧的学霸获得了大量的关注与议论。这背后,其实包含了很多研发机构的投入与思考。
日前,澎湃新闻(www.thepaper.cn)专访作为“华智冰”研发者之一的北京智谱华章科技有限公司(以下简称“智谱”)CEO和CTO。因为“华智冰”的诞生,这家公司更被视为人工智能领域的黑马公司。
智谱CEO王绍兰。本文图片均为受访者提供智谱CTO张鹏。以下是澎湃新闻与智谱CEO王绍兰、CTO张鹏对话的内容:
“让机器像人一样思考”
“华智冰”的研发耗资多少?培养“华智冰”预计还需要多少投入?
张鹏
:“华智冰”美貌和才华兼备,迎合了当下年轻人对于美的追求,对于新鲜事物的热爱。它背后所展现的人工智能技术应用,则是引发公众和业界激烈讨论的核心。对于企业,人工智能尖端前沿技术的研发,目前最棘手的问题就是找市场、找应用场景,简而言之就是商业化变现。人工智能从技术研发到市场落地的过程,要求会增加,周期会缩短,否则企业承受不了这么高的成本。技术还是要比市场更领先,然后再反哺市场,这是良性的发展。
如果算上背后超大规模人工智能预训练模型“悟道”的话,“华智冰”的研发其实耗资就会非常大。光是利用资源去训练这样一个模型,可能都是在千万级别以上的投入,硬件、软件还有人员的投入都是在千万级别以上。像GPT-3(生成型已训练变换模型3),训练一次的成本是460万美元。“华智冰”背后的“悟道”模型加上本身研发等,可能也差不多这样的量级。我相信未来还会持续去加大这方面的投入,毕竟“华智冰”所代表的尖端前沿的技术,是大家公认非常有前途的核心技术,在这方面进行投入是非常有必要,也是有价值的。
澎湃新闻
:刚才提及的超大规模人工智能预训练模型“悟道”是做什么?
王绍兰
:预训练大模型是认知智能双轮驱动的数据驱动部分。“华智冰”大脑的认知模型是“数据”和“知识”双轮驱动的,“悟道”在打造数据驱动的大模型,仿照人的学习过程,大量的自然语言、图片等多模态数据用来训练大模型;之后通过以知识图谱技术为核心的知识驱动系统,以及逻辑推理计算引擎以任务为导向让“华智冰”的能力发挥出来,让它像人一样有思考的能力。
澎湃新闻
:智谱已从“悟道1.0”走向“悟道2.0”模型,请问这两者最大的差别是什么?贵公司对“悟道3.0”有什么设想吗?未来的研发重点是什么?
张鹏
:1.0也好,2.0也好,它是不断在做知识的融入,数据的增加,模型的规模扩大,能力的提升,应用场景拓展,3.0会相较于现有的版本再上一个台阶。更重要的是,关注它的成长性,我们还是希望人工智能这样的虚拟载体,能真的像人一样去学习。
人类智能的核心之一就在于学习。现在的普通的机器学习模型的训练过程,就是把大量数据通过算法进行训练,它训练出来的模型,就不能变了。如果应用场景变化的话,又得回炉使用新场景的数据再训练一遍。
人不是这样的,人学到了基础知识之后,会去考试、跟人交流、去各种场景下应用这些知识,再接受新的反馈,不断地学习。
对于机器来讲,“悟道”正在向这个方向不断努力,并且在不断的完善和改进,让它有像人一样的自我更新和学习能力。有了这种能力后,再进一步实现思考的能力,我们未来的目标,就是围绕这样的方向去设计的。
“智能产业规模将会超过互联网产业”
澎湃新闻
:智谱拥有清华的学术背景,请问对公司的发展和路径规划起到了哪些作用?如何平衡学术与商业?
王绍兰
:智谱源于清华大学计算机系知识工程实验室,得益于清华大学的科技成果转移转化的政策,2019年成立。
这也使得我们能够“两条腿走路”,一是脚踏实地做好下一代人工智能技术研究;二是做好人工智能场景赋能,为企业、科研机构、政府等客户服务。
我们有成系列的科技情报大数据PaaS和SaaS服务,比如论文/专家检索、人才画像、企业画像、人才评价、企业科技竞调、论文解读、产业链和创新链分析、科技趋势分析等;
还有知识图谱工具PaaS, 比如500万节点的K12(从幼儿园到十二年级)教育所有学科知识点图谱、COVID(冠状病毒病)知识图谱等服务;以及基于预训练大模型的PaaS,例如万亿参数超大规模中英图混合预训练模型、万亿参数预训练模型问答系统等。
上面这些服务已经有大量的用户群,包括企业、政府、科研机构等。例如在科技情报领域,有近千家科技期刊的编辑部都在使用我们的SaaS服务,帮助提升期刊的影响力和评审稿效率;地方政府使用我们的科技人才服务,帮助加速双招双引、产业链和创新链建设工作;我们的服务帮助企业人才引进、科研合作、竞争分析、以及科技前沿订阅;还有认知智能的典型应用包括智慧问答、政策咨询,以及手语服务。
澎湃新闻
:人工智能如何商业化,它的市场机会在哪?
王绍兰
:我们一开始的目标就很明确,要让机器像人一样去思考,这是基于现在市场的需求,和对未来方向的判断。人工智能行业的特点是技术先行,首先要有新技术,之后赋能产业。下一代人工智能是认知智能,它所能赋能的市场领域将会远超过上一个感知智能时代。年初投资界的网红方舟资本预测,未来智能产业规模将会超过互联网产业。这是很有可能的。有些技术机构在5到10年后,将会成长为巨兽。认知智能具有的文本理解能力、总结能力、逻辑和推理能力、以及创造能力是之前的人工智能不具备的,或者是指标上达不到的。所以认知智能比如智能问答、智能助手、创作辅助、数字人等将会赋能数字金融、教育数字化、游戏和生活等领域和场景,创造巨大的市场机会和空间。