合成数据公司Synthesis AI发布了 HumanAPI,这是一种用于从合成数据生成虚拟人的新工具。虚拟人是逼真的数字表示,可以像虚拟环境中的真人一样移动、说话和行事。这些虚拟人旨在帮助开发人员改进人工智能应用程序的开发。
此次发行正值人们对 Metaverse的想法越来越兴奋之际。Facebook 最近更名为 Meta 以专注于元宇宙,在这个地方,人类和虚拟人可以通过 AR 和 VR 等技术以新的方式进行交互。另一家公司 Nvidia 在今天的 GTC 活动中发布了一系列公告,旨在构建元宇宙,包括新的头像技术。比赛开始了。
合成数据有助于解决为开发 AI 应用程序创建一组强大的标记训练数据方面的挑战。用于识别视频中对象的受监督的 AI 应用程序开发始于标记数据,这些数据反映了 AI 正在学习识别的内容。
通常,标记过程从真人手动标记视频帧开始。有时,标签是通用的,例如表示“坐着”或“站立”,任何人都可以正确标记。在其他情况下,例如区分运动或瑜伽姿势,需要更昂贵的专家来正确区分姿势的细微差异。在这种传统的标记方法中,人类专家必须手动标记反映不同体型、服装和摄像机角度的每个变化。
但是,合成数据生成可以自动执行此过程。它可以自动生成与手动标记数据中相同姿势的人的图像,然后将这些标签复制到新图像中。这消除了手动标记工具生成的每个新变化的需要。主要的好处是专家只需手动标记几个帧,然后合成数据会创建反映人的不同特征的变化,例如肤色、体型等——这些变化也会携带适当的标签。
HumanAPI 旨在简化应用程序开发
HumanAPI 补充了公司现有的用于生成虚拟面孔的 FaceAPI 服务。这些产品有望简化工作流程并提高分析人类外表、情绪、活动、运动、手势、人体工程学和其他特征的人工智能应用程序的质量。具体来说,HumanAPI 会自动生成一系列虚拟人,展示应用程序可能会在不同人和环境中看到的共同差异,从而改进对他们进行训练的应用程序。
Synthesis 首席执行官 Yashar Behzadi 告诉 VentureBeat,“除了电影、媒体、AR/VR 和游戏中的常见用例之外,虚拟人还可用于构建和测试计算机视觉 AI 系统。”
合成人还可以通过模拟一系列人类的用户体验来改进物理产品设计。例如,Synthesis AI 与汽车制造商合作创建更好的驾驶员安全系统。必须确保这些系统对于各种体型、体型和年龄的人来说都是直观且稳健的。
生成大量不同的合成人类涉及将电影视觉效果中使用的传统方法与新的生成 AI 模型相结合。HumanAPI 可以从一组黄金标记数据开始,然后应用反映各种光照条件、身体类型、肤色、服装或其他特征的各种变换。合成数据还可以通过从新数据中删除个人身份信息来解决隐私问题。
合成数据和虚拟人的新用例
虚拟人还可以改进智能 AI 助手、虚拟健身教练和元界应用程序。Behzadi 预测,“下一代智能 AI 助手将利用摄像头来推动更具情感意识的互动。”
通过考虑用户的注意力和情绪,这些系统将更自然地参与和交谈。虚拟人可以模拟无聊、参与、分心和疲倦等人类状态,从而产生更好的智能助手和更自然的交互。
在未来,反映人、物体和环境的合成数据工具可以让元节应用程序更容易地从现实世界中采样和重组数据。示例包括从您最喜欢的运动员的角度观看体育比赛、与朋友的逼真头像互动或亲身体验实物产品。所有这些应用程序都依赖于计算机视觉 AI 来深入了解人类、物体、3D 环境以及它们之间的交互。
“创建这些 AI 功能需要大量高质量的标记 3D 数据,而这些数据只能使用合成数据技术和虚拟人生成,”Behzadi 说。