探索与争鸣 | 熊红凯 :人工智能危险来自于输出的不确定

熊红凯/上海交通大学电子信息学院教授

2017-09-03 18:50

字号
人工智能,从上世纪50年代到现在起起伏伏。我最早不喜欢神经网络的原因是在于它的不确定性,即最后输出的结果是不确定的,今天深度学习卷积神经网络的不确定性依然存在。当时从哲学意义上来讲它是一种革新,所以大家很喜欢,到2005年又开始兴起,起因是说它好像又非常好,把结果推广到一些人类的竞赛上。其实在美国机器学习学术界依然是两派,一部分还是看不起深度学习,今天宣传深度学习更多是工业背景。很多领域都开始尝试深度学习,包括我们实验室也做了3-4年,因为所有观点和意见都要和深度学习方法对比,调网络调一个月,很多时候是要靠调试员的经验,因为有不确定性。
说人工智能是洪水猛兽,我更多的是从安全性角度来讲。首先它的推动主体是企业,既然它具有不确定性,而且又是企业和资本来推动,我认为这对公众安全存在问题,不透明,存在黑箱操作的空间。第二,它的技术本身,包括学界对深度学习排斥的一点在于不可解释性,由于它本身来自于神经网络,很多时候是靠穷尽局部的采样特性和不明确的非线性,丧失了理论的简洁和优美,如果科学的本意是告诉我们这个世界可以认知。相对我们原来竭尽心力,基于数学或者是几何的原理解释,理解明确的原因,最近我们两三年一直在做的动机,现在从事的一些课题,就是希望确实能确认深度学习的可解释性,同时尝试从传统的技术来演化深度机制,二者寻求共同性,单纯从神经计算来似是而非的解释,其实是不负责任的,知识应该是可追朔的,否则这种经验是不可靠的,工具和方法必须要有原理来支撑!以前我们了解的传统技术,在控制上都是有因果性来推动,我们希望能发展非常非常简洁的算法。今天深度学习的算法不具有广泛的一致性,从应用上,一个具有个性的深度学习算法,需要从小数据移植到大数据上去,也需要一套调试规则来阐述。
今天人工智能的深度学习,最大的推动力不在于算法,而是在于数据。其实现在这些大公司开源算法架构,只是为了占领人工智能的生态,这是商业策略。也就是说数据才是最后关键的因素。一个最后的结果,它的不确定性和不可操作性来源于数据,即使同一个数据不同的人操作也不一样,这就带来很大的问题:公共安全性,把这运用到生命医疗,现在都认为是最重要的应用,但这方面在美国就很谨慎。我们国家也在推动这方面,也引起关注,各种各样的数据被共享、被采纳。首先,它是把双刃剑,这东西带来的危害我觉得会更大。想想看,迄今我们人类一切技术的发展,都是以超越我们人自身的限制作为推动的。那这个大数据共享深度学习会走到哪里去,所有的机器都会联网,成为单方面庞大的力量,这个力量会决策我们每个人的命运。从伦理讲,我不知道这将来会是什么样一种方式来决定我们个人的命运,因为我们原来所形成的知识是个人可认知和可掌握的,是科学性的,是自由且公平的,这是做研究的最大动力。
今天说人脸识别在什么数据集下到了99%,不停刷性能,学术思想变成了各种排列组合的途径,这其实没有任何意义,学术的意义在哪里?首先,我们要认识这个世界,我们想让自身更自由一些,如果只是为了得到最后的某个结果,其实长远看没有什么太大价值。其次,要真实认识人工智能背后的基理所在,如果这个方式不解决,一旦垄断在一些大公司手里,现在跨国资本联合,实际上来讲是对我们个人的命运可能会很难。真实原因不在于机器,而是人性其实是不可靠的!
机器智能掌握在大资本手里对个人的运营是很难的,如果机器背后产生自觉的智能,如果它的智能(今天,只能说是计算和记忆的能力)确实超越了人类,按照自然法则来讲高级智能是可以去除掉低级智能,就像我们人类对地球其他生物正在实施的,没有什么对等的伦理。机器会不会有自我发掘智能,什么叫灵魂,值得反思!现在各行各业都在做计算机视觉和识别,单纯从性能角度讲提升都明显,完全可以融合,决策的性能在稳步提升,这么讲吧,人工智能深度学习的感知能力越来越强。更值得注意的是,机器人的动力系统发展也非常快,结合起来就是一种新的“生物”。这种生物不智能的话(类似某种动物一样),对我们有不确定的威胁;这种生物有智能的话,那就更具有危险性。也就是说,最后我们所面对的不是伦理上像我们这样的人。我其实很怕动物,总觉得它们不是我的同类,所以觉得“认为人工智能是洪水猛兽”还是很有道理的,因为对数据的操控性和选择性,所有的人类能力都在机器人的载体上形成发展,不管是它操控在我的同类人手里,还是即使它有良知,但它具有不确定性和不可解释性,我都不认为是可以淡定的。因为这种能力的控制性,完全不可靠,而且它会不断演化和发展。这会给我们这个人类世界带来极大的不确定性。也许将来,人类的定义需要改写。
我们现在也开始做一些大数据的信息加密,现在相关国际数据大企业都开始从事这种技术,信息被加密,在加密的基础上进行大数据的分析和处理,产生的效果要和明文原始信息的分析的效果趋于一致,便于各个机构间的数据共享。由于深度学习依赖于数据,一方面是数据驱动,一方面也要依赖知识的引导来加速计算。
现在的深度学习是数据的大规模计算,但这个计算本身并不带来知识,因为它只关心输入和最后输出的结果。阿尔法GO在人类围棋领域取得了巨大的成功,它以人类自古而有的棋谱作为标注的数据,以胜负作为最后的得失,所以每一步棋会计算最后胜算的概率。我们人类下围棋尽管理论上有这么多选择余地,但其实传承积累下来的候选空间并不大,阿尔法GO计算得失,还有计算每步棋最后获胜的概率,这是人类所没有的。
(本文首发于《探索与争鸣》杂志微信公众号:tansuoyuzhengming,熊红凯在2017年8月28日由上海市社联《探索与争鸣》杂志社和华东政法大学政治学研究院共同主办的“人工智能与未来社会:趋势、风险与挑战”学术研讨会上的主题发言,发言题目为《人工智能的范式转换及其发展前景》,澎湃新闻得到授权使用)
责任编辑:柴宗盛澎湃新闻报料:4009-20-4009   澎湃新闻,未经授权不得转载
关键词 >> 风险的来源,数据的输出

相关推荐

评论(6)

热新闻

澎湃新闻APP下载

客户端下载

热话题

热门推荐

关于澎湃 在澎湃工作 联系我们 版权声明 澎湃广告 友情链接