澎湃Logo
下载客户端

登录

  • +1

斯坦福人工智能百年研究:2030年人工智能与人类如何相处

机器之心(微信公众号:almosthuman2014)
2016-09-12 20:48
来源:澎湃新闻
能见度 >
字号

【写在前面】

美国工业界和学术界正在联手倒逼政府出台人工智能相关政策,不管是从资金上还是从法律上,希望能获得的更大力度的扶持。这也是斯坦福大学出台《人工智能与2030年的生活》这一报告的原因之一。报告分为三个部分,第一部分为AI的定义和研究趋势;第二部分为AI 的八大应有领域,包括交通、健康、教育等等;第三个部分为政策推荐,目的是希望推动相关政策的制定。澎湃新闻将分三个部分,全文刊出这份报告。以下为报告的序言和第一部分:

《人工智能与2030年的生活》报告指出AI 的八大应有领域,包括交通、健康、教育等等。资料图

2014 年秋季,美国斯坦福大学人工智能百年研究(One Hundred Year Study)项目启动,这是一项对人工智能领域及其对人类、社区、社会影响的长期学术研究。这项研究包含使用人工智能计算系统的科学、工程和应用实现。监督该“百年研究”的常务委员会(Standing Committee)组建了一个研究小组(Study Panel)来每五年评估一次人工智能所处的状态——这是本项目的核心活动。

本研究小组要回顾从上次报告到现在这段时间人工智能的进展,展望未来潜在的进展并且描述这些进展对于技术、社会的挑战与机遇,涉及的领域包括:道德伦理、经济以及与人类认知兼容的系统设计等等。

“百年研究”定期进行专家回顾的首要目标是:提供一个随着人工智能领域发展的关于人工智能及其影响的收集性的和连通的集合。这些研究希望能在人工智能领域的研究、发展以及系统设计方面、以及在帮助确保那些系统能广泛地有益于个人和社会的项目与政策上提供专业推断上的方向指南及综合评估。

这篇报告是计划持续至少100年的研究系列中的第一篇。常务委员会在2015年的暑期成立了一个研究小组来负责组建现在这个初始的研究小组,并任命了美国得克萨斯大学奥斯汀分校的教授Peter Stone 担任该小组的主席。这个包含了17名成员的研究小组由人工智能学术界、公司实验室以及产业界的专家与了解人工智能的法律、政治科学、政治以及经济方面的学者组成,并于2015年秋季中期启动。

参与研究的17名成员

参与者代表着不同的专业、地区、性别以及职业阶段。常务委员会广泛讨论了Study Panel 相应的责任,包括人工智能最近的发展与在工作、环境、运输、公共安全、医疗、社区参与以及政府的潜在社会影响。委员会考虑多种聚焦研究的方式,包括调查子领域及其状态、研究特定的技术(例如机器学习与自然语言处理)以及研究特定的应用领域(例如医疗与运输运输)。

委员会最终选择了“2030 年的人工智能与生活(AI and Life in 2030)”为主题以强调人工智能的各种用途与影响的发生不是独立于彼此,也不独立于其他许多社会和技术上的发展。意识到了城市在大多数人类生活中的核心作用之后,我们将专注重点缩小到大多数人居住的大都市。

第一部分:什么是人工智能?

本节介绍了研究人员和从业者如何定义“人工智能”以及目前正在蓬勃发展的人工智能研究和应用领域。它提出了人工智能是什么和不是什么的定义,并介绍了一些当前人工智能研究的“热点”领域。

本节为第二部分的内容奠定了基础,第二部分阐述了人工智能在八个领域和在第三部分中的影响与未来,第三部分介绍了涉及人工智能设计和公共政策的问题,并提出在保护民主价值的同时如何鼓励人工智能创新的建议。

1.定义人工智能

奇怪的是,人工智能缺乏一个精确的、被普遍接受的定义,这或许有助于该领域的加速成长、繁荣以及前进。虽然人工智能的从业者、研究人员和开发人员由一种粗略的方向感和一个“与它相处”的命令所引导,人工智能的定义仍然很重要,而Nils J. Nilsson 就提供了一个有用的定义:”人工智能就是致力于让机器变得智能的活动,而智能就是使实体在其环境中有远见地、适当地实现功能性的能力。”

从这个角度来看,对人工智能的表征取决于个人愿意“适当地”并“有远见地”为功能性提供合成软件和硬件的信用。一个简单的电子计算器比人类大脑进行的计算要快得多,而且几乎从来不出错。

电子计算器智能吗?像Nilsson 一样,研究小组以一种宽泛的视角来看待此问题,认为智力取决于一个多维频谱。根据这一观点,算术计算器和人脑之间的区别不是某一类,而是规模、速度、自主性和通用性的区别。

同样的因素可以用来评估智能的其他各例——智能语音识别软件、动物大脑、汽车巡航控制系统、围棋程序、自动调温器——并将它们放置在频谱中的适当位置。虽然我们的宽泛解释把计算器列在了智能频谱中,但是如此简单的设备与今天的人工智能相比几乎没有相似之处。

从这个角度看,对人工智能的表征取决于个人愿意“适当地”并“有远见地”为功能提供合成软件和硬件的信用。一个简单的电子计算器比人脑计算快得多而且几乎从不出错。

人工智能的边界已经远远走在前面,而计算器可以实现的功能只是当下的智能手机的百万分之一。目前人工智能开发人员正在改进、推广和扩大从当下的智能手机中所建立起来的智能。事实上人工智能领域是一个不断努力推动机器智能向前发展的过程。

具有讽刺意味的是,人工智能正在遭受失去话语权的长期灾难,最终不可避免地会被拉到边界内,即一个被称为“人工智能效应(AI effect)”或“奇怪悖论(odd paradox)”的重复模式——人工智能将一种新技术带到了普通大众中去,人们习惯了这种技术,它便不再被认为是人工智能,然后更新的技术出现了。

同样的模式将在未来继续下去。人工智能并没有“交付”一个惊雷般改变生活的产品。相反人工智能技术以一个连续的、进步的方式正在继续更好的发展。

2.人工智能研究趋势

直到本世纪初,人工智能的吸引点主要在于它所传递的承诺,但在过去的十五年里,大多这样的承诺已经得到兑现。人工智能技术已经充斥了我们的生活。当它们成为了社会的一股中心力量时,该领域正在从仅仅建立智能系统,转向了建立有人类意识的、值得信赖的智能系统。

几个因素加速了人工智能革命。其中最重要的是机器学习的成熟,部分由云计算资源和广泛普及的、基于 Web 的数据收集所支持。机器学习已经被“深度学习(deep learning)”急剧地向前推进了,后者是一种利用被称作反向传播的方法所训练的适应性人工神经网络的一种形式。

信息处理算法的这种性能飞跃一直伴随着用于基本操作的硬件技术的显著进步,比如感觉、感知和目标识别。数据驱动型产品的新平台和新市场,以及发现新产品和新市场的经济激励机制,也都促进了人工智能驱动型技术的问世。

所有这些趋势都推动着下文中所描述的“热门”研究领域。这种编辑只是想要通过某个或另一个度量标准来反映目前比其他领域得到更大关注的领域。它们不一定比其他领域更重要或更有价值。事实上目前的一些“热门”领域在过去几年中并不怎么流行,而其他领域可能在未来会以类似的方式重新出现。

大规模机器学习

许多机器学习的基本问题(如监督和非监督学习)是很好理解的。目前努力的一个重点是将现有算法扩展到更庞大的数据集上。例如鉴于传统方法能够负担得起若干遍数据集的处理,现代方法是为单次处理所设计;某些情况只认同非线性方法(那些只关注一部分数据的方法)。

深度学习

成功训练卷积神经网络的能力非常有益于计算机视觉领域,比如目标识别、视频标签、行为识别和几个相关变体的应用。深度学习也在大举进军感知方面的其他领域,如音频、语音和自然语言处理。

强化学习

鉴于传统机器学习主要关注于模式挖掘,强化学习将重点转移到决策中,这种技术将有助于促进人工智能在现实世界中更深入地进入相关研究和实践领域。作为一种经验驱动型的序贯决策框架,强化学习已经存在了几十年,但是这个方法在实践中没有取得很大成功,主要是由于表征和缩放的问题。然而深度学习的出现为强化学习提供了“一贴强心剂”。

谷歌 DeepMind 开发的计算机程序 AlphaGo 在五次对抗比赛中击败了人类围棋冠军,它最近所取得的成功在很大程度上要归功于强化学习。AlphaGo 是通过使用一个人类专家数据库来初始化一个自动代理的方法被训练的,但随后提炼的方法是通过大量地自我对抗游戏以及应用强化学习。

机器人

至少在静态环境中,机器人导航在很大程度上被解决了。目前的努力是在考虑如何训练机器人以泛型的、预测性的方式与周围世界进行交互。互动环境中产生的一个自然要求是操纵,这是当下所感兴趣的另一个话题。

深度学习革命只是刚开始影响机器人,这在很大程度上是因为要获得大的标记数据集还很困难,这些数据集已推动了其他基于学习的人工智能领域。

免去了标记数据需求的强化学习可能会有助于弥合这一差距,但是它要求系统在没有错误地伤害自己或其他系统的情况下能够安全地探索出一个政策空间。在可信赖的机器感知方面的进步,包括计算机视觉、力和触觉感知,其中大部分将由机器学习驱动,它们将继续成为推进机器人能力的关键。

计算机视觉

计算机视觉是目前最突出的机器感知形式。它是受深度学习的兴起影响最大的人工智能子领域。直到几年前,支持向量机还是大多视觉分类任务所选择的方法。但是特别是在 GPU 中的大规模计算的汇合,使得更大数据集的可获得性(尤其是通过互联网)以及神经网络算法的改进导致了基准任务中能的显著提高(比如 ImageNet 中的分类器)。计算机首次能够比人类更好地执行一些(狭义定义的)视觉分类任务。目前的研究多是关注于为图像和视频自动添加字幕。

自然语言处理

自然语言处理是另一个通常与自动语音识别一同被当做非常活跃的机器感知领域。它很快成为一种拥有大数据集的主流语言商品。谷歌宣布目前其20%的手机查询都是通过语音进行的,并且最近的演示已经证明了实时翻译的可能性。现在研究正在转向发展精致而能干的系统,这些系统能够通过对话而不只是响应程式化的要求来与人互动。

协同系统

协同系统方面进行的是对模型和算法的研究,用以帮助开发能够与其他系统和人类协同工作的自主系统。该研究依赖于开发正式的协作模型,并学习让系统成为有效合作伙伴所需的能力。能够利用人类和机器的互补优势的应用正吸引到越来越多的兴趣——对人类来说可以帮助人工智能系统克服其局限性,对代理来说可以扩大人类的能力和活动。

众包和人类计算

在完成许多任务方面由于人类的能力是优于自动化方法的,因而在众包和人类计算方面,通过利用人类智力来解决那些计算机无法单独解决好的问题,该领域研究调查了增强计算机系统的方法,这项研究的提出仅仅是在大约15年前,现在它已经在人工智能领域确立了自己的存在。最有名的众包例子是维基百科,它是一个由网络公民维护和更新的知识库,并且在规模上和深度上远远超越了传统编译的信息源,比如百科全书和词典。

众包专注于设计出创新的方式来利用人类智力。Citizen科学平台激发志愿者去解决科学问题,而诸如亚马逊的Mechanical Turk等有偿众包平台,则提供对所需要的人类智力的自动访问。通过短时间内收集大量标记训练数据和/或人机交互数据,该领域的工作促进了人工智能的其它分支学科的进步,包括计算机视觉和自然语言处理。基于人类和机器的不同能力和成本,目前的研究成果探索出了它们之间理想的任务分离。

算法博弈理论与(基于) 计算机(统计技术的)社会选择

包括激励结构、人工智能的经济和社会计算维度吸引到了新的关注。自20世纪80年代初以来,分布式人工智能和多代理(multi-agent)系统就已经被研究了,于20世纪90年代末开始有显著起色,并由互联网所加速。一个自然的要求是系统能够处理潜在的不恰当激励,包括自己所感兴趣的人类参加者或公司,以及自动化的、基于人工智能的、代表它们的代理。

备受关注的主题包括计算机制设计(computational mechanism design)(一种激励设计的经济理论,它寻求激励兼容的系统,其中输入会被如实报告)、(基于) 计算机 (统计技术的) 社会选择(computational social choice)(一种有关如何为替代品排列顺序的理论)、激励对齐信息获取(incentive aligned information elicitation)(预测市场、评分规则、同行预测)和算法博弈理论(algorithmic game theory)(市场、网络游戏和室内游戏的平衡,比如poker——它在近几年通过抽象技术和无遗憾学习(no-regret learning)已经取得了显著的进步)。

物联网(IoT)

越来越多的研究机构致力于这样一个想法:一系列设备可以相互连接以收集和分享它们的感官信息。这些设备可以包括家电、汽车、建筑、相机和其他东西。虽然这就是一个技术和无线网络连接设备的问题,人工智能可以为了智能的、有用的目的去处理和使用所产生的大量数据。目前这些设备使用的是令人眼花缭乱的各种不兼容的通信协议。人工智能可以帮助克服这个“巴别塔”。

神经形态计算

传统计算机执行计算的冯诺依曼模型,它分离了输入/输出、指令处理和存储器模块。随着深度神经网络在一系列任务中的成功,制造商正在积极追求计算的替代模型——特别是那些受到生物神经网络所启发的——为了提高硬件的效率和计算系统的稳定性的模型。

目前这种“神经形态的(neuromorphic)”计算机尚未清楚地显示出巨大成功,而是刚开始有望实现商业化。但可能它们在不久的将来会变成寻常事物(即使仅作为冯诺依曼所增加的兄弟姐妹们)。深度神经网络在应用景观中已经激起了异常波动。当这些网络可以在专门的神经形态硬件上被训练和被执行,而不是像今天这样在标准的冯诺依曼结构中被模拟时,一个更大的波动可能会到来。

总体趋势以及人工智能研究的未来

数据驱动型范式的巨大成功取代了传统的人工智能范式。诸如定理证明、基于逻辑的知识表征与推理,这些程序获得的关注度在降低,部分原因是与现实世界基础相连接的持续挑战。规划(Planning)在七十和八十年代是人工智能研究的一根支柱,也受到了后期较少的关注,部分原因是它强烈依赖于建模假设,难以在实际的应用中得到满足。

基于模型的方法——比如视觉方面基于物理的方法和机器人技术中的传统控制与制图——已经有很大一部分让位于通过检测手边任务的动作结果来实现闭环的数据驱动型方法。即使最近非常受欢迎的贝叶斯推理和图形模式似乎也正在失宠,被数据和深度学习显著成果的洪流所淹没。

研究小组预计在接下来的十五年中,会有更多关注集中在针对人类意识系统的开发上,这意味着它们是明确按照要与之互动的人类特点来进行建模与设计的。很多人的兴趣点在于试图找到新的、创造性的方法来开发互动和可扩展的方式来教机器人。

此外在考虑社会和经济维度的人工智能时,物联网型的系统——设备和云——正变得越来越受欢迎。在未来的几年中,对人类安全的、新的感知/目标识别能力和机器人平台将会增加,以及数据驱动型产品数量与其市场规模将会变大。

研究小组还预计当从业者意识到纯粹的端到端深度学习方法的不可避免的局限性时,会重新出现一些人工智能的传统形式。我们不鼓励年轻的研究人员重新发明理论,而是在人工智能领域以及相关领域(比如控制理论、认知科学和心理学)的第一个五十年期间,保持对于该领域多方面显著进展的觉察。

(本文经机器之心,微信公众号:almosthuman2014授权转载,禁止二次转载,澎湃新闻获授权转发)

    澎湃新闻报料:021-962866
    澎湃新闻,未经授权不得转载
    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈