长期以来,游戏一直是人工智能社区的肥沃试验田,这不仅仅是因为它们易于被大众想象。游戏还使研究人员能够模拟人类智力的不同模型,并对表现进行量化。因此,2016年DeepMind的AlphaGo算法(由2019年ACM计算奖得主、该公司强化学习研究小组的负责人大卫·西尔弗开发)战胜世界围棋冠军李世石,在计算社区内外都引起了兴奋,这并不令人意外。事实证明,这场胜利仅仅是个开始;该算法的后续迭代已经能够在没有任何人类数据或除了游戏规则之外的先验知识的情况下学习,最终,甚至不知道规则。在这里,Silver谈论了这项工作是如何发展的,以及它对通用人工智能的未来意味着什么。
你是玩国际象棋和拼字游戏长大的。是什么吸引你去的?
没有找到条目