《富春山居图》——元朝画家黄公望的代表作品,因其山水布置疏密有致、墨色浓淡并用而著称,为中国十大传世名画之一。
这幅旷世的山水画,在清朝惨遭火焚,画卷被烧成一大一小两段。
几百年后,这幅因遭火焚而断成长短两卷的传世名画,在百度世界大会现场实现了“合璧”——百度通过其文心大模型将这幅画补全了。
更令人称奇的是,这场虚拟修复也并非单纯的还原,而是带有创作意味。如果用户在百度App搜索“富春山居图”,在中间空白处简单勾勒几笔,画卷就会迅速自动补全,描绘出具有个人特色的山水图景。
这并不是AI第一次完成独立的创作。在补全《富春山居图》之前,百度的AI数字人希加加和度晓晓就曾取得过发布并售卖和Qee熊、FE赛车合作的画作、挑战高考语文作文且能够40秒写40篇等成果。
这些成果的背后都离不开AI底层技术的发展,也意味着AIGC时代离我们更进一步。
走向内容的AIGC时代
AIGC(AI-generated content),即AI生产内容,是一种继UGC、PGC之后全新的内容生产方式,它的出现正在改变内容产业的传统生产流程。
当人工智能技术发展到一定程度,AIGC就会带来新的生产工具,即用人工智能来生产想要的东西,只要有创意,就能做到真正意义上的数字化。
随着Metaverse、web3.0等概念在商业世界的普及,AI内容生成也备受关注。其实,早在2015-2017年左右,国外就已经出现过两拨基于单点技术把产品迅速做火的AIGC案例,但很快便销声匿迹。
当时都是互联网产品经理的思维,认为一个全新的技术就能创造全新场景。而最近这几年随着算法在各领域发展,AIGC也一直在进化。
比如最近在抖音大火的数字人柳夜熙,比如今年众多厂商都在尝试的虚拟歌姬,都意味着无论从技术还是产品思维层面,AIGC的时代离我们更近了一步。
有知名投资人认为Metaverse落地得有三个组成部分:AIGC(AI generated content)、DAO(Decentralized Autonomous Organization)和云(Cloud)。
对于虚拟世界来说,AI则是以基础设施的角色参与到Metaverse的建设与发展中。AIGC分为两大部分:一个是图像侧的AI,包括围绕人物角色展开的骨骼动画生成、面部表情生成、动作捕捉等技术,以及围绕空间场景展开的图像识别、场景生成、资产导入等技术,还有围绕基础建设展开的渲染、建模、渲染、粒子系统等技术。
在内容产业经历过爆发期后,该领域诞生了众多超级平台,其中不乏互联网巨头。期间,内容生产方式一直是各平台之间一项重要竞争壁垒,但无论是以UGC还是PGC自重,内容生产者留存和内容生产成本都是其绕不过的难题。
AIGC的出现就可以大幅化解这一维度上的企业发展困境。
一方面,在深度学习框架和大模型的结合下,AIGC的内容输出已经可以达到接近人类创作的水平,甚至于有更难以复制的创造性和独特性;另一方面,以人工智能为基础的创作引擎,在长期的内容生产过程中只需依靠稳定的技术迭代而不用重复投资,从商业角度考虑其成本模型也将不断得到优化。
李彦宏在百度世界大会上表示,AIGC不仅会提升内容生产的效率,也会创造出有独特价值和独立视角的内容。
他认为,AIGC会走过三个发展阶段:第一个阶段为AIGC的“助手阶段”,AIGC用来辅助人类进行内容生产;第二个阶段为AIGC的“协作阶段”,AIGC以虚实并存的虚拟人形态出现,形成人机共生的局面;第三个阶段为AIGC的“原创阶段”,AIGC将独立完成内容创作。大模型技术的突破,正在加速这个发展趋势。
李彦宏认为,“未来十年,AIGC将颠覆现有内容生产模式。可以实现以‘十分之一的成本’,以百倍千倍的生产速度,去生成AI原创内容。”
随着AIGC走向“原创阶段”,现实只会是愈加低廉的成本带来愈发独特和独立的原创内容,真正实现高效低价的“有人格的AI”——正如今天人们仅用轻轻几笔连接画中山河,就能得到一幅独属于自己的水墨世界那样。
比如百度就正在尝试通过大模型帮助提升素材和物料的生产效率、降低成本,探索文化创作、交互等场景的更多新玩法,更大限度地拓展艺术家及普罗大众的创作空间。
未来,基于大模型的AIGC有望成为内容生产的主流模式。
百度AICG背后的技术底座
无疑,AIGC能够提升内容生产的效率,并带来新的内容创意和方式。而“合璧”《富春山居图》的出现,以及度晓晓凭借画作和文章的成功“出圈”,都离不开它们背后百度文心大模型这一底层技术的支撑。
正是在文心大模型的支持下, AI才会具备很强的理解和生成能力,能够实现创意作品的自动生成,包括AI作画、AI写歌、AI剪辑等。
2010年起,百度开始深耕AI技术,打造了中国第一个自主研发、开源开放的产业级深度学习平台飞桨,相当于人工智能时代的操作系统。
彼时,TensorFlow、PyTorch两个深度学习开发平台框架正在全球范围内走红,国内有不少人工智能应用均是基于这两个框架平台所提供的各种服务和封装模块进行开发。飞浆虽然在刚出现时没有立刻获得足够的关注和使用频次,但在百度的战略级别重视下,该平台的普及度和受认可度有所上升。
在此期间,飞浆主要针对四个方面实现突破,包括开发框架的便捷性、深度学习模型训练技术的规模量级、高性能推理引擎的多端多平台部署,以及产业级别的开源模型库。此后,飞浆渐渐覆盖了数十种芯片型号,包括英特尔、英伟达、瑞芯微、寒武纪等硬件厂商,在国产硬件领域逐渐拥有了自己的地位。
基于飞桨,百度进一步攀登预训练大模型的技术高地,打造了具备“知识增强”能力的文心大模型(ERNIE)。
文心是百度自主研发的产业级知识增强大模型,全景图由模型层、工具与平台层和大模型创意与探索社区构成。它既包含基础通用的大模型,也包含面向重点任务领域和行业的大模型,以及丰富的工具与平台,支撑企业与开发者进行高效便捷的应用开发。
据介绍,文心系列模型基于持续学习的语义理解框架,从大规模知识和海量数据中融合学习,这可以实现更高的效率和更好的效果,其中多个模型已达到世界领先水平,陆续获得了国际权威排行榜GLUE第一名、复杂语言理解任务评测SuperGLUE第一名等成绩,比肩谷歌T5、OpenAI GPT-3等大模型。
这些成绩最终成为了百度AIGC的输出能力。
在“无界”系列作品的创作过程中,度晓晓便使用了文心大模型跨模态图文生成模型ERNIE-ViLG,只需要输入一段语言描述,AI系统就可以在数十秒内生成一幅充满想象力和艺术审美的高清画作,并且能够根据个性化需求自动化生成油画、水墨画、中国画等多种风格的不同分辨率图像,以及实现“看图说话”的效果。
目前,文心大模型已大规模应用于百度搜索、信息流、智能音箱等互联网产品,内部日均调用达万亿次,与此同时,文心大模型通过飞桨开源开放平台和百度智能云,已经广泛参与到工业、能源、金融、通信、媒体、教育等各行各业,基于文心的开放能力,其对外的日均调用量也已经超过了五千万次。
甚至在航天领域,百度飞浆和文心大模型也开始展露头角。百度方面表示,在战略价值上,航天行业大模型可作为航天领域的AI基础设施,而作为中国航天的战略合作伙伴,百度将为中美航天竞争贡献技术力量。
不难看出,在预训练大模型领域,突出的泛化能力和强通用性正在成为更重要的评判标准,这也是人工智能能够得到顺利发展的关键方向和坚实基础。
百度文心大模型的优势便在于,它通过与飞浆这一深度学习框架的融合发展,能够打造更具自主创新能力的AI底座,这也是其在服务产业的过程中拥有更强AIGC输出能力的核心。
AIGC对于元宇宙及未来虚拟世界的意义的重要性不言而喻。无论是海外的Meta还是国内的BAT,无一不在该领域展开积极布局。在技术进展的加持下,AIGC将为元宇宙世界创造出大规模的、逼真的内容。
对于元宇宙而言,AIGC的变革性意义在于其将带来零边际成本的内容生产,这是一场内容生产革命,只有通过AGIC,元宇宙才可能以低成本、高效率的方式满足海量用户的不同内容需求。
而对于大公司而言,这场技术的军备竞赛,才刚刚开始。