acm-header
登录

ACM通信

研究突出了

技术角度:智能汽车的新标准


DARPA对自动驾驶的挑战激发了令人印象深刻的技术演示,展示了人工智能最近的基本进展,并突出了未来研究的重要方向。

以下是Sebastian Thrun的文章,让我们得以一窥DARPA两项大挑战获奖作品的设计和实现。这些机器人系统的实现得益于过去25年来人工智能在表示、学习和控制方面取得的进展。

知道自己不知道的事情对机器人和人类一样重要。以概率的方式明确地表示不确定性,并使用贝叶斯技术增量地合并信息,使构建稳健和有效的系统成为可能。长期以来,概率估计方法一直被用于相对受限的应用,如目标跟踪。它们可以扩展到高度复杂的空间,比如周围障碍物的地图和其他车辆的意图,这对嵌入物理世界的智能系统的成功至关重要。这种系统包含了来自各种传感器的信息;事实上,成功融合来自惯性导航源、视觉和距离传感的传感器信息,是这里强调的机器人汽车的一个关键方面。在未来,这类系统将估算抽象的数量,如人类司机的目标和满意度,并将从引擎噪音、天气报告到人类乘客的对话内容等信息整合到他们周围世界的全面图景中。

评估技术最终建立在模型之上,这些模型告诉我们感知输入与世界的基本状态是如何相关的,以及世界的未来状态与之前的状态是如何相关的。传统上,这样的模型是手工建立的:专家系统模型是用表示直觉知识的逻辑规则指定的;用代表物理规律的线性-高斯分布和经验检验结果来指定估计系统。这些模型要么太脆弱,要么在代表性上太有限,无法支持智能机器人。

机器学习提供了一种从数据中获取模型的方法:这些模型可以是高度非线性的,以现实世界的数据为基础,并可以随着周围世界的变化而不断更新。本文为我们提供了一个很好的学习示例:很难制作一个视觉检测器,用于判断是否可以在所有照明条件、地形类型等情况下行驶。然而,在任何给定的条件下,找到一个简单的模型来区分可行驶和不可行驶的地形显然并不太难。因此,Stanley的系统使用了一个在线自我监督学习系统,不断调整模型,根据视觉输入预测驾驶性能。自我监督方面特别有趣。该车辆使用近程激光传感技术,将其附近的地形标记为可驾驶;这些数据被用来学习一个模型,然后允许在更远的距离上进行驾驶性能的视觉预测。今天,几乎所有的系统都是在现实世界的数据上运行的语音,视觉,语言使用从数据中学习的模型来进行稳健的估计和预测。


本文中描述的系统展示了实现真正集成的、健壮的、与物理世界交互的智能系统目标的重要步骤。


最后,重要的是系统如何运行。车辆必须表现稳健,通过考虑环境状态来选择适当的行为,从道路摩擦到行人,到司机的欲望,以及自身对状态的不确定性。本文描述了在不同抽象层次上运行的规划和控制系统,每个抽象层次都试图选择能够最大化预期效用的行动:也就是说,在给定机器人的不确定性的情况下,它们的平均表现会很好。此外,为了减少不确定性,可以选择明确的行动,比如将摄像机对准适当的方向,或者驱车前往以前未探索过的地点。鲁棒性还取决于时间敏感决策:当突然出现障碍时,车辆必须立即停止,没有时间详细权衡所有选项。本文介绍的车辆具有多层控制系统,确保对不断变化的环境条件做出快速反应,同时允许对更高级别的决策进行更深入的考虑。

Thrun描述的系统展示了实现真正集成的、健壮的、与物理世界交互的智能系统目标的重要步骤。它们将激励新老研究人员,推动普遍智能和健壮的机器人,管理无处不在的不确定性、人类互动和复杂的竞争目标,以大幅提高交通的安全性、乐趣和效率。此外,这些相同的基本技术将为家庭、医院和工厂的智能机器人的革命性进步提供基础。

回到顶部

作者

莱斯利包装Kaelbling是麻省理工学院计算机科学与工程学教授。

回到顶部

脚注

DOI: http://doi.acm.org/10.1145/1721654.1721676


©2010 acm 0001-0782/10/0400 $10.00

允许制作本作品的全部或部分的数字或硬拷贝用于个人或课堂使用,但前提是该拷贝不是为了盈利或商业利益而制作或分发,并且该拷贝在第一页上带有本通知和完整引用。以其他方式复制、重新发布、在服务器上发布或重新分发到列表,需要事先获得特定的许可和/或付费。

数字图书馆是由计算机协会出版的。版权所有©2010 ACM有限公司


没有发现记录

登录为完全访问
»忘记密码? *创建ACM Web帐户
文章内容:
Baidu
map