记者 |佘晓晨
除了火遍全国的冰墩墩,虚拟人也成为这届冬奥会的一大亮点元素。
以体育明星谷爱凌为原型的数智人Meet Gu最先亮相。在2月5日谷爱凌首秀、2月7日谷爱凌首金的两天里,Meet Gu出现在咪咕冬奥演播室与主持人互动,用1:1的还原展示了虚拟动态形象。
图片来源:咪咕视频同样在冬奥会登场的还有“3D虚拟冰冰”、AI虚拟气象主播“冯小殊”等,分别以央视记者王冰冰和“中国天气”主持人冯殊为制作基础。为人熟知的虚拟歌手“洛天依”也在奥林匹克文化节中献唱。
虚拟人在不同场景下“各司其职”,让冬奥会成为行业应用的一次大型试验田。
互动性已经成为每个虚拟人的标配。以“3D虚拟冰冰”为例,和以往相比,“3D虚拟冰冰”身形更加立体化,声音、语气、肢体动作等也更为丰富,在外表、行为、交互上具备多重人类特征。此外,科大讯飞推出了《冰冰带你说冬奥》专属H5,通过点击屏幕,用户可以与屏幕里的虚拟冰冰互动。这其中涉及的技术不只是3D建模,还有语音合成、AI驱动口唇表情合成、虚拟人肢体动作控制等技术,不再局限于单一的仿真。
如果说谷爱凌和王冰冰的数字人只是激发了人们与虚拟人互动的兴趣,另一些虚拟人则在冬奥中发挥更为实际的效用。
2021年11月,百度智能云和央视联合推出“AI手语主播”。在这届冬奥会中,这位虚拟主播通过AI技术为听障用户提供手语服务,发挥了人工手语主播的作用。
图片来源:百度和超写实数字人相比,虚拟手语主播的形象谈不上逼真,但背后涉及的AI技术相对复杂。
据了解,该虚拟人基于百度的智能数字人平台曦灵打造,采用自研的语音识别、机器翻译等人工智能技术。
百度需要构建出⼀套手语翻译引擎,从而实现字及音视频内容到手语的翻译。之后,再通过专为手语优化的自然动作引擎进行虚拟形象的驱动,将手语实时演绎为数字人的表情动作。
这也体现出虚拟人行业的一种发展趋势:在文娱互动之外,虚拟人“从外表走向内心”,叠加更多技术为垂直领域服务。
AI虚拟气象主播“冯小殊”也是一个典型的例子。这是一个由中国气象局华风气象传媒集团联合微软小冰公司共同创造的虚拟人,制作伊始,“冯小殊”就以“中国天气”主持人冯殊为训练目标,依托小冰框架数字孪生虚拟人技术构建而成。
小冰方面称,在技术方面,“冯小殊”结合了小冰深度神经网络渲染技术(Xiaoice Neural Rendering, XNR)及小样本学习技术,将整体自然度提升至与真人难以分辨的程度,训练周期仅为一周。
结合语音专家模型、嘴型专家模型及人脸渲染专家模型的训练,“冯小殊”准确学习了冯殊本人的嘴部动作、眼部及脸部肌肉之间的协同关系,最终呈现出自然、逼真的效果。
值得一提的是,上述虚拟人的制作均有科技大厂的身影,包括阿里、科大讯飞在内的公司,都为冬奥会特别定制了虚拟人。
当然,这首先是出于冬奥会本身的重要性。而技术和应用的逐渐成熟,则为这场虚拟人的集中亮相做了铺垫。
2021年,得益于“元宇宙”概念的火爆,面向C端和B端的虚拟人公司逐渐从幕后走向台前,上述大厂也竞相入局。头豹研究院的数据显示,当前虚拟数字人市场规模已超过2000亿元,预计这一数字到2030年将达到2703亿元。
但从产业出发推动虚拟人应用落地并非易事。有虚拟人行业的创业者曾向界面新闻表示,国内市场中,大部分公司对于虚拟偶像、虚拟人甚至虚拟内容的认知停留在“产业+虚拟”的阶段中,未来更大的生意应当在“虚拟+产业”方面,这是一个更加长线的过程。
从制作技术本身来看,不同公司存在诸多差距,不是每个虚拟人都能逼真如人类。除了建模、动捕等,AI技术也是决定未来虚拟人成熟程度的重要因素。这一点上,微软小冰、百度、阿里等公司具有较长时间的积累,但光靠大厂还远远不够。
此外,说服更多产业应用虚拟人则是又一难题。
中信建投证券在研报中指出,海外虚拟人公司的底层技术相对发展较快,在CG、驱动等方面更具优势,而国内虚拟人类型更加多元化,在触达用户的广度上更具优势。虚拟人在此次冬奥会的亮相或许是一个起点,未来能否延续更多产业化的应用,还要看技术和商业化的双重发展。