大多数用于翻译、在Facebook上为照片打标签以及优化导航最佳路径的人工智能都依赖于人类提供一些信息来启动。我们向算法展示哪些句子在其他语言中是等价的,一个人在不同照片中的样子,以及如何规划汽车的最佳路径。
但是一些AI研究人员正在探索如何赋予算法一种好奇心,使它们可以在没有任何人类指导的情况下学习。埃隆·马斯克、萨姆·奥尔特曼和其他硅谷大佬创立的非营利人工智能实验室OpenAI与加州大学伯克利分校和爱丁堡大学的研究人员合作进行的新研究发现,当一个AI算法被赋予了对好奇心的简单定义时,它可以在不需要人类提供信息的情况下探索50多款视频游戏,并且甚至可以击败其中一些游戏。
但好奇心是有代价的。研究人员还发现,由于AI代理人被奖励去看新事物,有时它们会故意死掉,只是为了看到“游戏结束”画面,或者被一台假电视和遥控器吸引,不停地换台寻找新节目。
人工好奇心的定义
OpenAI团队使用的人工好奇心定义相对简单:算法会试图预测未来一帧环境会是什么样子。当下一帧出现时,算法将根据其预测的错误程度获得奖励。这个想法是,如果算法能够预测环境会发生什么,那么它以前就见过这种情况。
这就是为什么AI代理在《超级马里奥》等游戏中表现出色的原因——游戏基于探索前方并进入下一关。
电视的特殊之处
OpenAI研究员哈里·爱德华兹告诉Quartz,让AI代理人换台的想法来自于一个被称为“嘈杂电视问题”的思维实验。电视上的静态非常随机,因此一个好奇心旺盛的AI代理人永远无法真正预测接下来会发生什么,并被吸引到永远观看电视的状态。在现实世界中,你可以将其想象为完全随机的东西,就像光线在瀑布上波动一样。
研究人员通过将数字电视放入3D环境中,并允许代理人按按钮换台来测试他们的理论。当代理人发现电视并开始换台时,源源不断的新图像使电视变得不可抗拒。
爱德华兹表示,有时AI可以从电视节目中抽身而出,但只有当周围的环境比电视上的下一个节目更有趣时才会如此。
超越游戏
这项研究的目的不仅仅是通过AI击败视频游戏,还包括了理解算法如何更好地解释周围世界。由于这些算法在探索视频游戏的所有角落和缝隙方面表现出色,研究人员表示它们也可以被调整为使调试代码更容易,或者通过视频游戏以确保没有任何故障。
本文来自投稿,不代表TePhone特锋手机网立场,如若转载,请注明出处:https://www.tephone.com/article/7904