下载客户端

探索与争鸣 | 熊红凯：人工智能危险来自于输出的不确定

熊红凯/上海交通大学电子信息学院教授

2017-09-03 18:50

人工智能，从上世纪50年代到现在起起伏伏。我最早不喜欢神经网络的原因是在于它的不确定性，即最后输出的结果是不确定的，今天深度学习卷积神经网络的不确定性依然存在。当时从哲学意义上来讲它是一种革新，所以大家很喜欢，到2005年又开始兴起，起因是说它好像又非常好，把结果推广到一些人类的竞赛上。其实在美国机器学习学术界依然是两派，一部分还是看不起深度学习，今天宣传深度学习更多是工业背景。很多领域都开始尝试深度学习，包括我们实验室也做了3-4年，因为所有观点和意见都要和深度学习方法对比，调网络调一个月，很多时候是要靠调试员的经验，因为有不确定性。

说人工智能是洪水猛兽，我更多的是从安全性角度来讲。首先它的推动主体是企业，既然它具有不确定性，而且又是企业和资本来推动，我认为这对公众安全存在问题，不透明，存在黑箱操作的空间。第二，它的技术本身，包括学界对深度学习排斥的一点在于不可解释性，由于它本身来自于神经网络，很多时候是靠穷尽局部的采样特性和不明确的非线性，丧失了理论的简洁和优美，如果科学的本意是告诉我们这个世界可以认知。相对我们原来竭尽心力，基于数学或者是几何的原理解释，理解明确的原因，最近我们两三年一直在做的动机，现在从事的一些课题，就是希望确实能确认深度学习的可解释性，同时尝试从传统的技术来演化深度机制，二者寻求共同性，单纯从神经计算来似是而非的解释，其实是不负责任的，知识应该是可追朔的，否则这种经验是不可靠的，工具和方法必须要有原理来支撑！以前我们了解的传统技术，在控制上都是有因果性来推动，我们希望能发展非常非常简洁的算法。今天深度学习的算法不具有广泛的一致性，从应用上，一个具有个性的深度学习算法，需要从小数据移植到大数据上去，也需要一套调试规则来阐述。

今天人工智能的深度学习，最大的推动力不在于算法，而是在于数据。其实现在这些大公司开源算法架构，只是为了占领人工智能的生态，这是商业策略。也就是说数据才是最后关键的因素。一个最后的结果，它的不确定性和不可操作性来源于数据，即使同一个数据不同的人操作也不一样，这就带来很大的问题：公共安全性，把这运用到生命医疗，现在都认为是最重要的应用，但这方面在美国就很谨慎。我们国家也在推动这方面，也引起关注，各种各样的数据被共享、被采纳。首先，它是把双刃剑，这东西带来的危害我觉得会更大。想想看，迄今我们人类一切技术的发展，都是以超越我们人自身的限制作为推动的。那这个大数据共享深度学习会走到哪里去，所有的机器都会联网，成为单方面庞大的力量，这个力量会决策我们每个人的命运。从伦理讲，我不知道这将来会是什么样一种方式来决定我们个人的命运，因为我们原来所形成的知识是个人可认知和可掌握的，是科学性的，是自由且公平的，这是做研究的最大动力。

今天说人脸识别在什么数据集下到了99%，不停刷性能，学术思想变成了各种排列组合的途径，这其实没有任何意义，学术的意义在哪里？首先，我们要认识这个世界，我们想让自身更自由一些，如果只是为了得到最后的某个结果，其实长远看没有什么太大价值。其次，要真实认识人工智能背后的基理所在，如果这个方式不解决，一旦垄断在一些大公司手里，现在跨国资本联合，实际上来讲是对我们个人的命运可能会很难。真实原因不在于机器，而是人性其实是不可靠的！

机器智能掌握在大资本手里对个人的运营是很难的，如果机器背后产生自觉的智能，如果它的智能（今天，只能说是计算和记忆的能力）确实超越了人类，按照自然法则来讲高级智能是可以去除掉低级智能，就像我们人类对地球其他生物正在实施的，没有什么对等的伦理。机器会不会有自我发掘智能，什么叫灵魂，值得反思！现在各行各业都在做计算机视觉和识别，单纯从性能角度讲提升都明显，完全可以融合，决策的性能在稳步提升，这么讲吧，人工智能深度学习的感知能力越来越强。更值得注意的是，机器人的动力系统发展也非常快，结合起来就是一种新的“生物”。这种生物不智能的话（类似某种动物一样），对我们有不确定的威胁；这种生物有智能的话，那就更具有危险性。也就是说，最后我们所面对的不是伦理上像我们这样的人。我其实很怕动物，总觉得它们不是我的同类，所以觉得“认为人工智能是洪水猛兽”还是很有道理的，因为对数据的操控性和选择性，所有的人类能力都在机器人的载体上形成发展，不管是它操控在我的同类人手里，还是即使它有良知，但它具有不确定性和不可解释性，我都不认为是可以淡定的。因为这种能力的控制性，完全不可靠，而且它会不断演化和发展。这会给我们这个人类世界带来极大的不确定性。也许将来，人类的定义需要改写。

我们现在也开始做一些大数据的信息加密，现在相关国际数据大企业都开始从事这种技术，信息被加密，在加密的基础上进行大数据的分析和处理，产生的效果要和明文原始信息的分析的效果趋于一致，便于各个机构间的数据共享。由于深度学习依赖于数据，一方面是数据驱动，一方面也要依赖知识的引导来加速计算。

现在的深度学习是数据的大规模计算，但这个计算本身并不带来知识，因为它只关心输入和最后输出的结果。阿尔法GO在人类围棋领域取得了巨大的成功，它以人类自古而有的棋谱作为标注的数据，以胜负作为最后的得失，所以每一步棋会计算最后胜算的概率。我们人类下围棋尽管理论上有这么多选择余地，但其实传承积累下来的候选空间并不大，阿尔法GO计算得失，还有计算每步棋最后获胜的概率，这是人类所没有的。

（本文首发于《探索与争鸣》杂志微信公众号：tansuoyuzhengming，熊红凯在2017年8月28日由上海市社联《探索与争鸣》杂志社和华东政法大学政治学研究院共同主办的“人工智能与未来社会：趋势、风险与挑战”学术研讨会上的主题发言，发言题目为《人工智能的范式转换及其发展前景》，澎湃新闻得到授权使用）

校对：张亮亮

澎湃新闻报料：021-962866

澎湃新闻，未经授权不得转载

我要举报

#人工智能能战胜人类吗 #风险的来源 #数据的输出