acm-header
登录

ACM通信

新闻

解决原因


牛顿的摇篮

信贷:虚线雪人

得益于庞大的数据集和机器学习,计算机在寻找众多变量之间的统计关系——并利用这些模式做出有用的预测——方面已经变得惊人地熟练。无论这项任务是识别照片中的物体,还是将文本从一种语言翻译成另一种语言,如今的智能机器所能完成的大部分任务都源于计算机基于统计关联或相关性做出预测的能力。

总的来说,计算机非常擅长这种预测。然而,对于许多任务来说,这还不够。哥本哈根大学的统计学教授乔纳斯·彼得斯说:“在现实中,我们通常不仅想预测事情,还想改善事情。”“这就是你需要因果方法的原因,”Peters解释道,他是一本关于因果推理的书的合著者,这是一个近年来在计算和其他科学领域引起兴趣的研究领域。随着这一领域的发展,它建立了越来越多的数学严谨性,为不同学科的科学家提供了一种正式的语言来明确表达他们的假设,并为获取新知识提供了更好的工具。

在计算领域,对因果关系的关注有望帮助研究人员克服困扰人工智能(AI)传统方法的缺点。

回到顶部

如何更好地做决定

当彼得斯谈到改善事物时,他所指的“事物”涵盖了从帮助大学生掌握新材料到减缓气候变化的方方面面。哪种教学方法最有效?哪些政策能真正减缓全球变暖?正如彼得斯所指出的,这些不是经典的预测问题,而是因果的问题。这些问题和无数类似的问题旨在揭示的不仅仅是一个变量和另一个变量之间的相关性,而是一个变量的积极变化如何影响另一个变量的发生——对潜在系统的因果理解。

例如,如果你知道A和B是相关的,那么是A导致了B吗?相反,是B导致了A吗?还是说,A和B之间根本没有直接的因果关系? A和B之间的关联是因为某个第三变量C而产生的,它导致了A和B?拥有正确的因果模型对于知道如何做才能得到你想要的结果是至关重要的。“如果你想做任何决定,你都需要了解因果关系,”在普渡大学电气与计算机工程学院教授并进行因果推理研究的穆拉特·科考格鲁说。“想象你有一些政策”——你正在考虑的一些行动——“你想要了解当你执行这个政策时会发生什么。因果模型可以帮助你估计行为的结果。”

如果理解因果关系对做出正确的决定至关重要,那么当我们让人工智能参与决策时,我们必须教会它这些因果关系。当涉及到使决策公平时,这样做的重要性尤为明显:我们如何确保算法决策,特别是在招聘、贷款和刑事判决等高风险领域使用时,不会延续甚至放大人类决策者的偏见?

因果关系研究人员认为,教计算机理解因果关系是关键:他们说,错误地关注虚假的相关性往往会导致不公平的歧视。彼得斯说:“如果这是一种相关性,但不是因果关系,那通常会被认为是不公平的。”他用一个故意荒谬的根据头发长度来招聘的例子来说明自己的观点。如果数据显示,平均而言,头发较长的人(通常是女性)在某项工作中表现更好,而头发长度和性别实际上都不能提高工作表现,那么在招聘中使用这些标准对男性和女性都是不公平的;这对雇主也不利,因为雇主的目标是雇佣最适合这份工作的人。弄清楚到底是什么原因良好的表现,比如一套特定的技能,将导致更好的招聘决定。

回到顶部

更健壮的人工智能

因果关系研究人员表示,除了帮助做出更好的决策外,因果推理还有潜力提高机器学习算法的性能,即使是在纯粹的预测任务中。哥伦比亚大学(Columbia University)计算机科学副教授、该校因果人工智能实验室(因果人工智能实验室)主任埃利亚斯•巴雷因博伊姆(Elias Bareinboim)表示:“我们今天在人工智能领域遇到的大多数瓶颈和挑战都来自因果关系能力的缺乏。”

其中一个巨大的挑战是目前许多人工智能系统的脆弱性——当它们面对的条件与它们受训时的条件稍有不同时,它们往往会失败。大多数现有的机器学习模型忽略了因果关系,假设训练和测试数据来自相同的分布,但这通常不是一个安全的假设。例如,如果你想准备一个机器人在未来的太空任务中在火星上挖石头,你可能能做的最好的是训练它在地球上挖石头,也许在加利福尼亚沙漠。自动驾驶汽车在一个国家受训,然后部署到其他地方,情况也是如此。

当然,目标是让机器人和其他人工智能灵活地适应不断变化的环境。毕竟,这种能力显然是人类智能的一种形式。如果你在美国郊区学开车,那么你在法国郊区开车很可能不会有什么困难。人工智能研究人员正在探索各种方法,以使机器同样善于适应不断变化的条件,而因果推理领域的研究人员有充分的理由认为因果关系可以有所帮助。彼得斯解释说:“通常可以有把握地假设大多数因果机制保持稳定。”“因此,理解一个系统的因果结构可以帮助我们快速适应新环境。”


弄清楚到底是什么导致了良好的表现,比如一套特定的技能,将有助于做出更好的招聘决定。


然而,弄清一个系统的因果结构对于机器和人类来说都是困难的。“在很长一段时间里,我们甚至不知道吸烟是否会导致癌症,”科考奥格鲁指出。我们只有观察数据,也就是显示吸烟和癌症之间关联的数据。由于对吸烟进行随机对照试验是不可能的,而且在20世纪50年代,科学家们还没有开发出没有这种对照试验的因果推理方法,他们努力排除吸烟以外的其他因素导致吸烟者肺癌发病率更高的可能性。

当小孩子通过玩耍了解世界时,他们所做的事情类似于随机对照试验。“一个蹒跚学步的孩子可以采取行动并观察结果,”考考格鲁说。这样做可以让蹒跚学步的孩子弄清楚,例如,掉落玩具会导致它掉落。但在经典的机器学习中,数据并不是随机的:“如果你有一个单一的数据集,你对每一行都有一个单一的结果——你从来不会采取不同的行动,也不会观察到不同的结果,”科考格鲁说,他的研究领域是因果发现,试图从非随机数据中学习因果关系的过程。

回到顶部

一个共同的语言

Williams学院的计算机科学家Rohit Bhattacharya教授一门关于因果推理的课程,并开发了从“混乱的”数据中推断因果关系的方法——包含缺失数据和统计偏差(如选择偏差)的数据集。他说:“各行各业的人们已经思考因果关系很久了。”他说:“计算机科学为因果社区提供的好处是图形语言。”他指的是加州大学洛杉矶分校的计算机科学家朱迪亚·珀尔开发的具有直观吸引力的节点和因果箭头系统图灵奖。根据巴塔查里亚的说法,Pearl的巨大贡献是“它使计算机科学家能够与统计学家和医生交谈。”(珀尔的因果推理并不是唯一的通用语言:内曼-鲁宾因果模型,有时被称为潜在结果框架,也被广泛使用,特别是在经济学、政治学和法学研究中。)

哥伦比亚大学教授、Pearl的博士生导师Bareinboim补充道,图形的形式语言提供了另一个优势:创建因果图形模型需要科学家明确他们对潜在因果机制的所有假设,从而为任何自动化因果推断的尝试铺平了道路。

彻底、明确的表述对于因果发现是必不可少的。如果你是一名计算机科学家,因果发现包括与你正在研究的学科的专家交谈,以揭示所有相关变量,并创建因果图,以代表关于变量之间关系的所有可能的竞争性假设。“变量之间不同的因果关系模式也意味着不同的关联模式,”巴塔查里亚解释说,所以发现过程的一部分是深入观察数据,看看这些假设中哪些与数据一致。

然而,一个特定的因果模型符合数据的事实并不意味着可以使用数据来估计影响的强度。因果推理的识别步骤回答了这个问题。这里,珀尔的另一个主要贡献发挥了作用:一个正式的系统称为微积分(它的名字反映了因果问题的主动性质,如“当我X ?”)。在其他方面,-微积分提供了一种方法来确定是否有可能计算出一项新干预对感兴趣结果的因果影响。与希望大数据掌握所有答案的希望相反,因果推理专家知道情况并非总是如此,特别是当数据有偏见或在其他方面混乱时。巴塔查里亚说:“答案可能是,‘这是不可能的,所以请不要让我们为了数据中不存在的东西而折磨数据。’”


与希望大数据掌握所有答案的希望相反,因果推理专家知道,情况并非总是如此,特别是当数据有偏见或在其他方面混乱时。


不过,如果有可能进行估计,机器学习就会有所帮助,使研究人员能够创建比传统统计分析(尤其是线性回归)更好地适应许多现实世界关系复杂性的模型。

最后,因为因果图包含假设,所以因果推断需要某种敏感性分析。“这就像是在说,‘最坏的情况是什么?“巴塔查里亚解释道。“‘如果我在图表上画的不太正确,我的估计能有多错?’”

*进一步的阅读

Hernán, M.A.和罗宾斯,J.M.
因果推论:如果,2020年12月,博卡拉顿:查普曼和霍尔/CRC,https://bit.ly/3Bdprni

珠儿,J。
《为什么之书:因果新科学》,https://bit.ly/2ZkCVAi

珠儿,J。
实证研究的因果图,生物统计学,第82卷,第4期,1995年12月,669-688页,https://doi.org/l0.1093/biomet/82.4.669

Peters, J., Janzing, D.,和Schölkopf, B.。
《因果推理的要素:基础和学习算法》,2017年11月29日,麻省理工学院出版社,https://bit.ly/3EepAsK

鲁宾,抓
在随机和非随机研究中估计治疗的因果效应,教育心理学杂志第66卷(5),1974年10月,688-701,https://bit.ly/3b6tibe

张杰,张晓明,张晓明。
决策的公平性——因果解释公式,2017年11月,https://www.cs.purdue.edu/homes/eb/r30.pdf

回到顶部

作者

总部位于旧金山湾区,玛丽娜Krakovsky是《《中间人经济:经纪人、代理人、经销商和日常媒人如何创造价值和利润》(Palgrave Macmillan)。


©2022 0001 - 0782/22/2 ACM

允许为个人或课堂使用部分或全部作品制作数字或硬拷贝,但不得为盈利或商业利益而复制或分发,且副本在首页上附有本通知和完整的引用。除ACM外,本作品的其他组件的版权必须受到尊重。允许有信用的文摘。以其他方式复制、重新发布、在服务器上发布或重新分发到列表,都需要事先获得特定的许可和/或费用。请求发布的权限permissions@acm.org传真(212)869-0481。

数字图书馆是由计算机协会出版的。版权所有©2022 ACM, Inc.


没有发现记录

登录为完全访问
»忘记密码? »创建ACM Web帐号
文章内容:
Baidu
map