互联网爱好者创业的站长之家 – 南方站长网
您的位置:首页 >运营 >

抛弃汽车本身?前Uber首席科学家完全在仿真模拟中进行人工智能驾驶员的训练

时间:2022-07-12 12:45:23 | 来源:市场资讯

来源:DeepTech深科技

制造无人驾驶汽车是一项缓慢而昂贵的业务。经过多年的努力和数十亿美元的投资,这项技术仍处于试点阶段。拉克尔·乌尔塔森(Raquel Urtasun)认为她可以做得更好。

2021 年,由于对行业的缓慢发展感到沮丧,乌尔塔森在主持了 Uber(一家叫车服务公司)的自动驾驶研究工作四年之后,离开了 Uber 并成立了自己的公司,名为 Waabi。“目前大多数自动驾驶的技术路线都太慢,以至于无法取得进步,”乌尔塔森说,她把主要精力投入了无人驾驶汽车行业和多伦多大学中。“我们需要一个完全不同的方案。”

公司现在透露了乌尔塔森押注的有争议的自动驾驶汽车新捷径,该捷径最大的创意是?抛弃汽车本身!

在过去的六个月里,Waabi 公司一直在建立一个超级真实的虚拟仿真环境,称为 Waabi 世界。Waabi 打算几乎完全在仿真模拟中进行人工智能驾驶员的训练,而不是在真实的车辆中。他们计划,在最后一轮微调之前,人工智能不会在真实道路上的真实车辆上进行测试。

问题是,一个人工智能要想学会处理真实道路的复杂情况,就必须暴露在它可能遇到的各种场景中。这就是为什么在过去的十年里,无人驾驶汽车公司累计在世界各地的街道上行驶了数百万英里。

一些公司,如 Cruise 和 Waymo,已经开始在美国一些简单的城市环境中测试无人驾驶车辆,但进展仍然缓慢。“为什么我们还没有看到这些试点的扩张呢?为什么那些车不是无处不在呢?”乌尔塔森问道。

乌尔塔森大胆而自信地担任了 Waabi 公司的负责人,该公司不仅没有对其技术进行道路测试,甚至连汽车都没有。但通过避免花费大部分研发成本在真实街道上测试软件,她希望打造一个比竞争对手更快、更经济的人工智能驾驶员,从而给整个行业带来急需的推动。

虚拟驾驶员

该公司并不是第一家开发虚拟现实世界来测试自动驾驶软件的企业。在过去的几年里,仿真模拟已经成为无人驾驶汽车公司的支柱。但问题是,仅凭模拟技术是否足以帮助业界克服技术难题,使得无人驾驶成为可行的选项。

“目前还没有人为自动驾驶汽车打造‘黑客帝国’,”Zoox(自动驾驶汽车初创公司,2020 年被亚马逊收购)的联合创始人兼 CTO 杰西·莱文森(Jesse Levinson)说。

事实上,几乎所有的自动驾驶汽车公司现在都以某种形式使用模拟技术。它加快了测试速度,向人工智能模型展示比实际道路上更广泛的场景,并降低了成本。但大多数公司将仿真模拟与真实世界的测试结合在一起,通常是在真实道路和虚拟道路之间来回切换。

“Waabi 世界”将模拟的利用提升到了另一个层次。这个虚拟世界本身是由人工智能生成和控制的,人工智能充当了驾驶教练和环境监督系统——识别人工智能驾驶员的弱点,然后重新布置虚拟环境来测试它们。

“Waabi 世界”能同时教授多个人工智能驾驶员不同的能力,然后将他们组合成一套技能。乌尔塔森说,这一切都是不间断地发生,并且不需要人类参与。

小概率事件

无人驾驶汽车公司使用仿真模拟来测试控制车辆的神经网络如何处理小概率事件——比如一个自行车快递员在前面变道插队,一辆跟天空一样颜色的卡车挡住了路,或者一只鸡过马路——并进行相应的自我调整。

“当你遇到一个很少发生的小概率事件时,需要数千英里的道路才能正确测试它,”西德·甘地(Sid Gandhi)说,他在 Cruise 公司从事模拟工作,该公司已经开始在旧金山的某些道路上测试全自动驾驶汽车。

这是因为小概率事件,或叫长尾事件,可能在一千次中只发生一次。他说:“当我们努力解决长尾问题时,我们将越来越少地依赖于现实世界的测试。”

每次 Cruise 公司升级其软件时,它都会运行数十万次仿真模拟来测试它。据甘地说,该公司将根据他们的汽车遇到麻烦的特定现实情况生成数千个场景,并调整细节以涵盖一系列潜在的场景。它还可以使用来自其汽车的真实摄像头数据,使模拟更加真实。

然后,工程师可以改变道路布局,更换不同类型的车辆,或改变行人的数量。最后,Cruise 公司使用自己的自动驾驶算法来控制仿真模拟中的其他车辆,使它们做出真实的反应。

甘地说,用这种合成数据进行测试比使用真实数据快 180 倍,也便宜数百万美元。

甘地说,Cruise 还在试验除旧金山以外其他美国城市的虚拟场景,以便在真实汽车开到这些地方之前,就在模拟街道上测试其自动驾驶软件。

其他公司也认为,仿真模拟是训练和测试自动驾驶人工智能的关键步骤。莱文森说:“在很多方面,模拟实际上比实际驾驶更有用。”总部位于英国的自动驾驶汽车公司 Wayve 也在交替进行模拟测试和真实道路测试。

该公司一直在伦敦繁忙的街道上测试自己的汽车,但车里一直有安全员。Wayve 公司的首席科学家杰米·肖顿(Jamie Shotton)说,模拟不仅通过降低测试成本加速了自动驾驶汽车的发展,而且还可以使测试更加可靠,这是因为模拟仿真更容易多次重复测试。

他说:“一次成功模拟的关键是不断努力增加其现实性和多样性。”

即便如此,在宣称仅靠模拟能有多大进展方面,Waabi 公司超过了其他人。和 Cruise 一样,Waabi 的虚拟世界也是基于真实传感器的数据,包括雷达和相机,它用这些数据来创建真实世界场景的数字孪生。

然后,Waabi 模拟人工智能驾驶员看到的传感器数据——包括可能会让摄像头糊涂的光滑曲面的反射,能让激光雷达失效的废气和烟雾——使虚拟世界尽可能真实。

但 Waabi 世界的关键角色是它的神一样的驾驶教练。当人工智能驾驶员学会处理一系列环境时,另一个人工智能模型则学会发现它的弱点,并生成特定的场景来测试这些弱点。

实际上,Waabi 世界让一个人工智能对抗另一个,智能教练学习如何通过设置特定挑战场景让智能司机失败,而智能司机则学习如何克服这些挑战。乌尔塔森说,随着人工智能驾驶员的进步,很难找到可能失败的案例。“你需要把它暴露在数百万甚至数十亿个场景下,才能发现其缺陷。”

乌尔塔森认为,在一个多样化的模拟中训练司机,更贴切地复制了人们学习新技能的方式。她说:“每次我们经历一些事情时,我们就会重新调整我们的大脑。”

在仿真模拟中让人工智能与自己或对手成百万次地对抗,这已经成为一种非常强大的技术。这就是 DeepMind 团队训练其人工智能玩围棋和星际争霸游戏的方式;这也是人工智能机器人在虚拟游乐场学习的方式,比如 DeeMind 的 XLand 和 OpenAI的捉迷藏,它们通过不断试错,学习基本但通用的技能。

但在模拟中给予人工智能行动自由的一个缺点是,它可以学会利用现实世界中看不到的漏洞。OpenAI的捉迷藏机器人学会了通过团队合作来躲避或寻找他人。但他们也在模拟中发现了一些小故障,得以让人工智能违背物理学,例如飞到空中或将物体推过墙壁。

企业需要确保其模拟结果足够准确,以阻止其人工智能驾驶员学习这样的坏习惯。神经网络总是会学会利用虚拟世界和现实世界之间的差异,乌尔塔森说:“他们知道如何作弊。”

乌尔塔森表示,该公司已经开发出了衡量真实和虚拟驾驶环境之间差异并能这种差异其尽可能小的方法。她还没有透露这项技术的细节,但表示 Waabi 计划公布该项工作。

仅使用仿真模拟,Waabi 能走多远将取决于 Waabi 世界到底有多真实。“仿真模拟正在变得越来越好,所以你可以在现实中学到而在模拟中无法学到的东西会越来越少,”莱文森说,“但我认为,要过很长一段时间才这种差异会消失。”

“在模拟和真实世界的测试之间保持合理的平衡很重要,”肖顿说,“对任何一家自动驾驶公司来说,最终的考验都是,在具有真实装备的任何复杂情况下,能将其技术安全地应用于道路上。”

乌尔塔森原则上同意。“我们仍然需要进行现实世界的测试,”她说,“但这要少得多。”

无论发生什么,乌尔塔森都坚持认为现状不能持续下去。“每个人都在做同样的事情,尽管我们还没有解决这个问题,”她说,“我们需要一些能加快这个进程的东西。我们需要一直采用这种新的思维方式。”

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。