为什么AlphaGo生在硅谷,而非中国?他说出了真实原因

汤晓鸥/中国科学院深圳先进技术研究院副院长、教授、商汤科技创始人 澎湃新闻记者 洪燕华 整理

2017-08-31 11:14 来源:澎湃新闻

字号
AlphaGo击败人类,唤起世人对人工智能的关注,继而在全球掀起人工智能大热潮。
AlphaGo是怎么来的?
“Google一年的研发投入是120亿美金,这是研发烧掉的,而不是整个公司的日常运营花费,正因为这样,才会有AlphaGo、自动驾驶等技术。2014年谷歌就愿意付6.6亿美金买一个小初创公司,这个公司只有12个人,没有任何的产品落地,就是用深度学习在玩游戏、下棋。他们会花这么高的价格来买这样的一家公司。如果在我们中国的商业环境下,可能花几百万美金挖人就够了,这样肯定经济效益更好。但是,就不会有后来的AlphaGo了。”
中国科学院深圳先进技术研究院副院长、香港中文大学教授、商汤科技创始人汤晓鸥8月30日在全球(上海)人工智能创新峰会上强调了这一点,峰会现场,他做了题为《人工智能的中国式文艺复兴》的演讲,强调了尊重原创的重要性。“他们愿意投入,就是对原创技术、对人才的尊重,才会有后面的AlphaGo。”
汤晓鸥曾发明人脸识别技术Gaussian Face,是世界上第一个超过人眼识别能力的计算机算法。早在1992年,在美国麻省理工学院攻读博士学位的汤晓鸥开始接触人脸识别的算法,获得博士学位后,他先后在香港中文大学和微软亚洲研究院工作,继续从事计算机视觉相关领域的研究。2014年3月,汤晓鸥研究团队发表了GaussianFace人脸识别算法。随后,汤晓鸥的实验室发布了更先进的DeepID算法,DeepID算法标志着人脸识别技术真正成熟。
对于当下的人工智能大热潮,汤晓鸥提醒说,人工智能并不是件赶时髦的事,人工智能需要高尖端人才长期积累潜心研发,并不是刚毕业的本科生做个网页那么简单,人工智能并不适合互联网式的“大跃进”发展,这是当下AI热潮中需要注意的问题。
汤晓鸥做了题为《人工智能的中国式文艺复兴》的演讲。上海市徐汇区新闻宣传中心供图
以下是汤晓鸥的演讲内容:
感谢组委会的邀请,今天我要讲的,想强调的就是两个字,原创。
原创,需要长期的积累、大量的投入,而不是一夜之间突然我们就都可以原创了。
每次我讲报告都会用我儿子的照片来开头。以前我会讲一些理由,比如他长得漂亮、或者是我以前用的人脸识别数据经常用他的照片做训练等等。今天,我讲原创,如何找理由联系?昨天晚上想了想,我想,儿子是我和我太太唯一的原创,是真正的原创。
说到原创,可能大家最近都看了一个电影《战狼2》,我还没有看,很难评价它好还是一般。但大家知道,它的票房已经是53亿(截止8月28日的数据),超过了《蜘蛛侠》《变形金刚》。这在十几年前完全不可想象,而且排行榜当中很多的电影都是全球的票房收入,而《战狼2》是靠中国一个国家的票房收入就做到了这点。可以做到这点有很多的原因,我不评价,因为没有看过。但有一个必要的原因,就是两个字:原创。
这个电影10多年前是否会发生?不会。那时候我们每个人花不到1美元,可以在大街上买到任何的好莱坞大片,不会花十几美元去电影院看这个电影,那时候中国不会有好的原创电影。所以长期以来,我们没有自己的顶级电影创作。最近这些年,大家对原创技术,对IP的尊重,对法律的维护,我们才会有《战狼2》这样的电影。
说到电影,中国的电影发源地就是上海。像20、30年代的时候,上海的电影发展好像并不落后于全球。当时我们在电影创作上,很多演员和导演都是非常非常有名。我也无法讲他们为什么会做得那么好,一个必要条件还是对原创、对IP的尊重,所以当时才会发展得那么好。很高兴,今天又开始恢复到那样的时代,我们的电影又可以重新崛起了。
上海,不仅是中国电影文化的发源地,也是中国现代文化的发源地。比如中国的商务印书馆,100多年前就创建了,也是标志着上海的现代文化的开始。当时有很多原创的东西,我们知道的一些文人大作家,包括鲁迅等非常有名的学者,他们写了很多的文章、小说,那时候如果他们没有版权收入,相信他们也活不下去。原创也无从谈起了。
再往远一点看,今天我为什么要讲文艺复兴,14到17世纪它真正的起来,有政治的原因、宗教的原因,各种各样的原因,但有一个必要条件,也是对原创的尊重。因为有了这些,才有了达芬奇、米开朗基罗、拉斐尔、莎士比亚等一系列非常优秀的艺术家和作家。
最后这张图上的这个作品大家可能会有一些疑问,说文艺复兴时候好像没有见过这个作品,这是我非常欣赏的现代艺术家的现代艺术作品,这个作品叫“纸上谈呯”,描写的是一个忧郁的艺术家弹琴,坐在一卷手纸上,非常原创,和旁边的米开朗基罗的“大卫”有异曲同工只妙。对不起,我实在编不下去了,其实这是我儿子的手工作品,主要还是想强调它的原创性,对手纸的应用很有创意。
下面来看一下今天的人工智能的原创,我们总是听到Google的声音,听到AlphaGo、谷歌的自动驾驶等等,为什么总是听到Google的声音?一个原因是Google一年的研发投入是120亿美金,这是研发烧掉的而不是整个公司的日常运营花费,正因为这样,才会有AlphaGo、自动驾驶等技术。2014年谷歌就愿意付6.6亿美金买一个小初创公司,这个公司只有12个人,没有任何的产品落地,就是用深度学习在玩游戏、下棋。他们会花这么高的价格来买这样的一家公司。如果在我们中国的商业环境下,可能花几百万美金挖人就够了,这样肯定经济效益更好。但是,就不会有后来的AlphaGo了。他们愿意投入,就是对原创技术、对人才的尊重,才会有后面的AlphaGo。
Facebook也是2013年左右,深度学习刚刚起来没多久,大量投入资金,组建深度学习实验室。
Eric(麻省理工学院的名誉校长Eric Grimson)提到了Mobileye,英特尔愿意花150亿美金收购这样的公司,其实这个公司也没有什么贵重的东西,就是一伙人,几个教授带一群学生做研究。他们花钱收购,而不是挖人。
大家都非常熟悉AlphaGo,在AlphaGo之前我和投资人讲深度学习,没有人愿意听,也没有投资人关心。但是这盘棋下完之后,投资人开始回过头和我讲什么是深度学习。AlphaGo在全球引起了巨大的轰动,因为围棋这件事,是脑力劳动非常强的活动,机器可以战胜人类确实看起来很了不起,但并不是说机器无比聪明,为什么机器可以下棋?是我们定义的任务,我们让他做下棋这件事。他所做的训练都是基于棋谱,所以他不会想控制人类这件事,他的任务是人类定义的。短期我们不用担心,长期也不用担心机器人控制人类这件事。AlphaGo真正轰动的意义是它的创新和深度学习的算法巨大的进步,这在全球引起了大量的报道。
紧接着谷歌在中国做了一个AlphaGo2,和柯洁下了一盘棋,也下得非常精彩,值得大家关注,也有一些新的技术出来。那周,中国媒体铺天盖地的报道。但你看雅虎、国外的网站,会有一点报道,但报道一下就可以了,不是搞得好像大家都靠这个活着。为什么?因为这是AlphaGo2。做原创,第一次做这件事是最重要的。就像捅破窗户纸一样,第一下很重要,第二下就不那么重要了,你已经知道房间里面发生什么事情了。
再看一个地图,Deep learning的搜索次数,颜色深代表搜索的次数多,浅的代表搜索次数少。大家可以看到中国的颜色最深,而且深很多,对这个词的搜索量最大。但是这是谷歌的搜索结果,谷歌在中国老百姓是搜不了的,你要翻墙,这大概只有做技术的人才知道怎么做。翻墙的搜索量都比全球的任何国家的搜索量高很多,可以想像这在中国有多热。为什么这么热?因为我们不懂,我们这么多年没有做原创技术。中国有句成语“不明觉厉”,因为你不知道怎么回事才觉得厉害。还有一句话叫“文人相轻”,你是文人,你知道他的水平和高度,互相之间会不服气,如果你都不是文人,哪里有资格去轻视别人呢。
前段时间Amazon、IBM、谷歌、微软,Facebook组成了人工智能联盟,当时我们觉得国外人工智能的发展已经非常非常超前了。我们如何竞争?Eric刚才讲了人工智能应该是全球的合作,是共赢。合作是双方都要做事情的,是双方平等的合作,不是说别人做了,你把它拿过来就用,然后赚钱,这不是合作,这是盗版。
人工智能,我们是否落后得很远?我从商汤公司做的事情来讲一下,我们现在处于什么水平。人工智能的发展历史我就不讲了,几起几落,前面的学者已经总结过了。真正的落地是2011年,深度学习算法在语音识别方面取得重大突破,是当时Hinton和微软的邓力合作取得的成绩。后来才有了2013年谷歌、Facebook的大量投入,和到现在的直线上升。
2011年我们开始做深度学习,当时应该是最大的华人团队。2011到2013年全球最顶级的计算机视觉学术会议CVPR/ICCV上,29篇文章涉及到深度学习,14篇由我们一个实验室做的,做了全球的一半。
最近两年,谷歌、Facebook开源了AI平台,相当于AI的操作系统。我们最早的时候没有Torch和TensorFlow,我们经过多年的积累,做出我们自己的深度学习Parrots系统,我们把几百块的GPU连起来。训练了1207层的深度学习网络,林达华教授带领学生做了这项工作,他也是从Eric实验室几年前毕业的博士生。
我们和Facebook竞争的例子,就是人脸识别。2014年Facebook发表了文章,人脸识别算法接近人眼的能力,我们同一时间发表了另外一篇文章,抢在Facebook之前,第一个用计算机做人脸识别超过人的眼睛。这其实是和AlphaGo相似的事情,在人类定义的一项任务上,机器超过了人类。我们当时用了20万的人脸数据做的。平时做研究,一两万的人脸数据就很了不起了。用了20万的人脸数据,我们觉得我们会碾压所有的人。还没有开始碾压,发现Facebook用了750万的数据,数据量上把我们碾压了。但是计算的结果,我们超过了他们,连做了3、4个算法,最后做到了99.5%,战胜Facebook。在中国,马上出现大批的公司重现一下算法,开始人脸识别落地应用的时代。
Imagenet,2012年有很大的突破。2014年是最大的一次比赛,38个团队,包括Google、伯克利、牛津,微软等顶级实验室都参加了,我们取得了全球第二名,输给了Google。当然,Google也是竞赛的组织者,我们赢他也比较难。
2015到2016年,ICCV、CVPR、ECCV三个顶级国际会议上发表的文章数量。微软124篇,CMU86篇,商汤和我们实验室一起76篇,全球前三名,我们是整个亚洲唯一前10名的团队。
最后看一下百度、阿里、腾讯,三家的估值加起来在9000亿美金上下。三家公司加起来的文章数是13篇。你想用AI作为你的未来,是要投入的,要做原创的,而不是拿来的。
我们取得的这些成绩,也得到了国际上的承认。
我们非常荣幸,和MIT、斯坦福,伯克利、谷歌等实验室,被评为全球十大人工智能先驱实验室,我们是整个亚洲唯一的代表。我讲的这些是学术上的研究和成绩。如果只有这些,其实我们没有数据,没有应用,我们的人也很少。一开始,会抢跑一下,领先一下,长时间的竞争我们无法持续抗衡Google这样超高投入的公司。所以我们也要落地,很幸运,通过积累,我们现在有120位深度学习的博士,核心人员体量和Facebook、Google差不多,我们是中国唯一一个深度学习平台公司。非常荣幸,这次《华尔街日报》报道我们单轮融资打破全球最大一笔AI创业公司融资记录,4.1亿美金。以前是我们以几千万美金,打一场看起来完全不对等的战争,现在我们补充进了弹药。非常高兴,到今天有400多家顶级的客户,包括中国移动,包括银联,包括华为等巨型公司。400家公司意味着过去一年半的时间,每天签约一家公司。我们用我们的深度学习平台为核心大脑,在做人脸识别,在做芯片、医疗、自动驾驶、金融,手机等14个行业的人工智能应用研发,和14个行业的合作伙伴合作,我们会反馈回来大量的应用需求和数据,形成完整的闭环、正循环。去年的双创活动中,很荣幸和百度被选为代表中国人工智能的两家企业,参加北京地区的展览。
最后还是用一个电影来结束。我这个年龄的人,对《上甘岭》这部电影都很熟悉,当时打的最后一场战斗,也就是一个连。
我们120个博士,也差不多就是这样的人数。如果我们这只队伍失败了,打散了,守不住《上甘岭》,中国人工智能的三八线也就基本结束了,谢谢大家!
责任编辑:洪燕华澎湃新闻报料:4009-20-4009   澎湃新闻,未经授权不得转载
关键词 >> 人工智能,汤晓鸥,商汤科技

相关推荐

评论(28)

热新闻

澎湃新闻APP下载

客户端下载

热话题

热门推荐

关于澎湃 在澎湃工作 联系我们 版权声明 澎湃广告 友情链接