人类可能是全自动驾驶汽车进入城市街道的最大障碍之一。机器人必须能够预测附近驾驶员、骑自行车的人和行人的行为,才能在波士顿市中心安全地驾驶车辆。然而行为预测问题很难解决,当前的人工智能解决方案要么过于简单(可能假设行人总是走直线),要么过于保守(为了避开行人,机器人只是把车停在公园里),或者只能预测一个代理的下一步动作(道路通常同时承载许多用户。)
据外媒报道,麻省理工学院(MIT)的研究人员设计出一种看似简单的解决方案,通过将多智能体行为预测问题分解成更小的部分并单独处理每个部分,使得计算机可以实时解决这一复杂任务。
图片来源:arxiv
研究人员的行为预测框架首先会猜测两个道路使用者之间的关系,哪辆车、骑自行车的人或行人拥有通行权,以及哪个代理会让路,并使用这些关系来预测多个代理的未来轨迹。
研究的共同主要作者Xin "Cyrus" Huang表示:“将我们的模型与该领域的其他最先进模型比较,如Waymo的模型,我们的模型在这个具有挑战性的基准测试中取得了最佳性能。”
多个小模型
研究人员将该机器学习方法称为M2I,需要两个输入:汽车、骑自行车的人和行人在交通环境(例如十字路口)中交互的过去轨迹,以及带有街道位置、车道配置等的地图。
使用此信息,关系预测器可推断出两个代理中哪一个首先拥有通行权,并将一个分类为通过者,一个分类为让行者。然后一个预测模型(边际预测器)猜测通过代理(独立运行)的轨迹。
第二个预测模型,称为条件预测器,会根据通过代理的动作猜测让行代理的动作。该系统为让行者和通过者预测许多不同的轨迹,分别计算每个轨迹的概率,然后选择发生可能性最高的六个联合结果。
M2I输出预测这些代理将如何在接下来的8秒内通过路口。在一个示例中,研究方法使车辆减速,以便行人可以过马路,然后在行人通过交叉路口时再加速。在另一个示例中,车辆等到几辆汽车通过后才从一条小街转向繁忙的主干道。
虽然这项初步研究侧重于两个代理之间的交互,但M2I可以推断许多代理之间的关系,然后通过连接多个边际和条件预测变量来猜测它们的轨迹。
真实世界的驾驶测试
研究人员使用Waymo Open Motion数据集训练模型,该数据集包含由安装在公司自动驾驶汽车上的激光雷达(光检测和测距)传感器和摄像头记录的数百万个涉及车辆、行人和骑自行车者的真实交通场景。研究人员特别关注具有多个代理的案例。
为了确定准确性,研究人员将每种方法的六个预测样本(按置信度加权)与场景中汽车、骑自行车者和行人所遵循的实际轨迹进行了比较。结果显示,他们的方法是最准确的。该方法还在被称为重叠率的指标上优于基线模型;如果两条轨迹重叠,则表明发生了碰撞。M2I的重叠率最低。
M2I的另一个优点是,因为它将问题分解成更小的部分,因此用户更容易理解模型的决策。研究人员表示,从长远来看,这可以帮助用户更加信任自动驾驶汽车。
但是该框架无法解释两个代理相互影响的情况,例如两辆车在四向停车时各自向前轻推,因为驾驶员不确定谁应该让步。
未来,研究人员计划解决该问题。此外,他们还希望使用该方法来模拟道路使用者之间的真实交互,从而可用于验证自动驾驶汽车的规划算法或创建大量合成驾驶数据,进而提高模型性能。