澎湃Logo
下载客户端

登录

  • +1

专访阿里云首席科学家周靖人:中国数据创新很可能引领世界

澎湃新闻记者 杨鑫倢 实习生 吴晓淳
2016-08-16 06:40
来源:澎湃新闻
10%公司 >
字号
阿里云ET的名字由来是,马云经常被人吐槽说长得像外星人。

“我现在的声音就是跟马老师学的。大家还说,我长得像抽象版马云,你们觉得呢?”在上周举行的云栖大会上,阿里云人工智能ET首次亮相,ET这段模仿阿里巴巴董事局主席马云的讲话腔调,逗乐了在场观众。

“ET之父”、负责ET研发的阿里巴巴人工智能研究机构iDST负责人周靖人,当天也是以新身份首次公开亮相。今年7月,他刚刚从微软合伙人的岗位离职,从美国西雅图举家来到中国杭州,担任阿里云首席科学家、阿里云副总裁,负责阿里巴巴人工智能和大数据方面的研究。

我们做技术的,需要很多应用场景验证。阿里巴巴能提供的场景和数据,是美国任何一家公司都提供不了的。”日前,周靖人接受了澎湃新闻(thepaper.cn)的专访。

中国正在经历数据高速发展期,而且很有可能弯道超车、引领世界,就像中国的移动支付毫无疑问是全球第一的。中国的数据创新在全世界都是佼佼者,阿里云提供的数据服务也随着这些数据开发者共同进步。”周靖人说。

在有限的采访时间里,周靖人给记者留下了“技术宅”的感觉,他爱谈自己对技术的理解,却不怎么爱谈自己回国工作的事儿。

ET模仿马云声音的效果,令人联想到前不久发布的微软人工智能“小冰”4.0版,小冰也能以接近人声的水平唱出《隐形的翅膀》。ET也是通过事先学习大量马云演讲录音进行模仿的。

对于“前东家”的同类产品,周靖人说,阿里ET的优势并非仅仅是陪人说学逗唱,“我们不希望培养一个只是单纯模仿人的人工智能,而是在某些方面超越人类,和人的能力形成互补,在商业社会发挥作用。”

ET目前已初步具备听、说、看的感知能力,并能够在交通、工业生产、健康等领域输出决策。

阿里云是阿里巴巴集团云计算公司的简称,向企业客户提供公有云业务。对企业而言,将IT系统部署到云上,可以提升运营效率,节省运维成本。企业可以输入阿里云ET所包含的技术,构建自己的人工智能。

周靖人早年毕业于中国科学技术大学,后游学美国,获得哥伦比亚大学计算机博士学位。周靖人是云计算大数据、大规模分布式系统和数据库等领域的国际级权威学者。就职于微软期间,周靖士带领团队研发了支撑着微软必应搜索,Office和Windows等公司产品的高能性大数据计算平台。该系统利用上万台规模的计算集群提供丰富多样计算能力,实时收集分析海量数据,是整个公司后台数据服务的基石。

周靖人是又一位从海外举家回国的博士。2014年底,澎湃新闻曾独家报道,《大数据》作者涂子沛任阿里巴巴副总裁,主导数据新商业模式的研究与应用实践,并带领iDST部门。涂子沛已于2016年初离职。

以下是澎湃新闻对话周靖人实录(有删节):

从微软到阿里:阿里有其他公司无法媲美的应用场景

对于“前东家”的同类产品,周靖人说,阿里ET的优势并非仅仅是陪人说学逗唱。

澎湃新闻:作为人工智能领域的学者,你认为,阿里巴巴和微软对于人工智能的理解有什么不同?

周靖人:两家都是不错的公司。在学术层面,很难讲有什么不一样,因为两家都有专家和能力去做研发。最大的不同可能是,阿里有很多应用场景,阿里不光是一个电商平台、还有支付宝、菜鸟物流、娱乐版块等很多场景,可以讲,这些场景和数据是其他公司包括美国公司都无法媲美的。正因为场景比较多,我们在人工智能上被磨练的应用场景会比较多,能让我们得到更有效的反馈。所有科学的发展都不是一蹴而就的,需要不停的迭代和发展。

澎湃新闻:之前你是微软“最年轻”的合伙人,为什么想离开,加盟阿里巴巴?

周靖人:合伙人只是一个职位,算是非常资深的职位。我谈谈为什么会到阿里这边。除了刚才说的阿里能提供更多场景,非常吸引我之外,中国正在经历数据高速发展期,而且很有可能弯道超车、引领世界,就像中国的移动支付毫无疑问是全球第一的。中国的数据创新在全世界都是佼佼者,阿里云提供的数据服务也随着这些数据开发者共同进步。

澎湃新闻:之前外国人对中国科技业的印象是山寨,但经过这几年发展,有美国杂志说“是时候山寨中国了”。你在美国时,有没有感受到中国互联网公司的这股力量?

周靖人:10年前大家交流比较少,就算有这些公司也不知道他们是干什么的,现在互相交流更多了,让更多人看到中国公司和中国市场的魅力,并且看到一些中国的机会。现在在美国上市的中国公司越来越多,中国公司的知名度在提高。

澎湃新闻:举家从西雅图来到杭州,做出这个决定的过程艰难吗?

周靖人:家里对我很支持,现在中美往来也方便。我们在美国西雅图有研发基地,我们在杭州会通过视频会议进行沟通,沟通时间是北京时间早上、美国时间晚上。我的家现在杭州,但我本人也会不定期飞回西雅图,而且我们在西雅图招一些专家,有些同事也会不定期地出差做一些技术上的交流。

阿里云造壁垒:比谷歌更早提出人工智能和大数据结合

澎湃新闻:阿里云的ET可以被应用到很多场景,包括用户上网个性化推荐、法庭庭审速记、直播软件实时转写、金融风控、心脏病预测、路况预测、公众趋势预测、智能客服、电子商务恶意行为监测等,ET似乎和别的公司研发的人工智能的应用方向不太一样?

周靖人:今天我们看到的这些技术,不光利用了人工智能,也利用了大数据技术,每一项都需要大量数据的分析和建模。不夸张地讲,这是大数据和人工智能的完美结合。

人工智能从上世纪50年代起,就有长足的发展,然而高速发展来自于近10年,为什么?首先,人工智能需要很多背后大量的计算能力。在过去,我们局限于人工智能单机的计算能力。随着分布式系统的计算能力的突飞猛进,我们可以利用成千上百的机器进行数据的分析,利用类似人类的神经网络无限的逼近现实。同时,大数据时代的到来,也意味着我们有各种各样的数据源,包括结构化的数据和非结构化的数据,这些数据源从不同的角度为现实的描述,我们利用人工智能挖掘数据的关联,极大提高了人工智能的准确性。

阿里云没有把人工智能作为单独的学科来看,而是和大数据一起当做整体来看,甚至有时候我们把它叫数据智能。这个领域是我们区别于其他的云提供商的一个重要的技术不同点。

澎湃新闻:2015年底,浙江省和阿里云开展试点,预测未来1小时内的路况,准确率稳定在91%以上。能不能揭秘一下,ET是如何预测未来几小时的交通状况的?

周靖人:我们在每个路口安放一个摄像头,通过智能视频的技术,对交通情况精准分析,包括行驶车辆的个数、路况当前实时状况等。一个摄像头的视角有限,我们需要成千上万的摄像头。收集上传成千上万的视频,实时对这些视频进行智能分析,这中间需要利用大数据、海量计算处理的能力。当我们有了全局的交通洞察之后,我们可以针对每一个路段,利用历史信息,算出一个计算模型,去预测5分钟后、10分钟后,乃至1小时后的路况信息(更准确地讲预测的是车辆运行速度)。因为每一个路段有特殊的特征,光靠一个模型是不够的,我们需要对每一个路段,进行特殊的建模。一个城市有成千上万的路段,我们要建立成千上万的计算模型。

这是一个很好的例子,可以看到从个体的感知到全局的智能,从一个智能摄像头到了解全局交通的状况,从一个十字路口计算模型到预测整个全局的路况。

澎湃新闻:谷歌也结合大数据做人工智能?

周靖人:对。这是趋势,但我们提得比较早。我们在人工智能的积累,不光光有最下面有计算平台,还有上面的机器学习平台,有认知能力。所谓认知能力,就是指机器能够听懂语音、识别视觉或图像的能力,再加上自然语言的理解,能够理解人与人之间的对话。阿里云还提供认知算法库,在任何一个开发者面前,如果他要很快的搭建应用去解决实际问题,都可以快速利用这些已有的模块,而不是重新去建造相应的能力。

澎湃新闻:现在出现一些以今日头条为首的新闻App,标榜通过大数据的算法推送用户喜欢的新闻,但业内有声音说,这其实也没有满足大家对新闻的需求,你如何理解这个问题?是数据不够大还是算法的问题?

周靖人:我们现在是处于一个数据智能的开始阶段。我们会在今后几年看到这个行业指数性的增长,但目前这阶段,仍然是有很多可以改进和改良的空间。今日头条在算法层面没有用阿里云的产品,所以这方面细节不了解。我觉得技术一方面在发展,数据的来源在改进,商业模式也在探索。

    澎湃新闻报料:021-962866
    澎湃新闻,未经授权不得转载
    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈