澎湃Logo
下载客户端

登录

  • +1

智库动态|中美人工智能产业差距2015年后显著加大

澎湃新闻记者 柴宗盛
2019-03-26 11:25
来源:澎湃新闻
全球智库 >
字号

人工智能在大国角力中占据越来越重要的位置,甚至人工智能的强弱,意味着尖端军事技术的强弱,因此中美人工智能实际水平格外引人注目。2019年3月20日,长江商学院在北京发布了《中国人工智能指数报告》,其中一些关键数据令人深思,譬如论文的引用量,以及人工智能创新公司的活跃度,中国都呈现出令人担忧的趋势。

《中国人工智能指数报告》由长江商学院人工智能与制度研究中心主任许成钢和武汉大学大数据与云计算实验室主任崔晓晖团队共同研究制作。该报告从学术、产业、开源软件包使用等方面进行中美对比,以此度量中国的人工智能在最近十几年里的发展及影响。

论文质量的差距巨大

从1995年至今,在Scopus数据库中(本文论文相关数据皆源于此数据库),可以被检索到的标注关键字为 Artificial Intelligence的全部中、美人工智能论文数量。

近些年在描述中国人工智能进步巨大的一个证据是,中国人工智能论文的发表量,在快速接近美国。这一趋势在2016之后尤其明显。但在最具原创性最具影响力的极高引用率和高引用率的论文方面,中国与美国的差距相当显著。最刺眼的是,中国人工智能论文数量大幅增加的同时,零引用的论文也在大幅领先于美国。而论文的千次、百次级别的引用,中国又大幅落后于美国。

图1 中美人工智能期刊论文年度发表量对比

图2 中美千级期刊论文引用总数量对比分析

图3 中美人工智能期刊论文被引用总数

中美学者每年在期刊发表的所有人工智能论文的被引用总数。由图可见,美国学者发表的期刊论文被引用数始终明显高于中国学者发表的论文。但是在2010年之后,中美之间的差距迅速下降,呈收敛趋势。

图4 中美百千级期刊论文引用总数量对比分析

中美两国学者发表的千级以及百千级期刊论文的总量以及被引用数。由于最具有影响力的论文被大量引用需要时间,我们只报告在2013年前发表的期刊论文中被引用次数达到或超过1000次和500-999次的论文的数量以及被引用总频次。美国在千级期刊论文发表数量及总引用量方面均远高于中国。中国学者在2004年,2005年和2007年各出现了一篇千级期刊论文,而同一时期美国学者发表了12篇千级引用量的期刊论文。在百千级期刊论文发表方面,美国仍然优势明显,但是两者之间的差距自2008年开始收窄,并于2010年基本趋于一致。总体上,中国学者在2004年,2005年以及2013年各发表了两篇百千级期刊论文;并于1997年,2006年,2008年以及2010年各发表了一篇百千级期刊论文。

图5 中美百级期刊论文引用总数量对比分析

百级引用量期刊论文和十级应用两期刊论文的发表数量以及被引用频次上,中国和美国在2010年前始终保持很大差距,但是在2010年之后两国差距逐步缩小。另外值得注意的是,在个级引用量以及无引用量的期刊论文方面,两国差距不是很显著,尤其是从发表数量上看,自2011年起中国开始小幅领先美国。

图6 中美零级期刊论文发表总数量对比分析

在零级会议论文(从未被引用的论文)方面,从2007年之后,中国作者的会议论文总数大幅度超过了美国。我们统计的所有会议论文都是在同行评议的专业期刊发表的会议论文,即会议论文的学术标准有同行评审制度的保证。我们推断,零级会议论文的主体是应用性的。可能因应用范围狭窄,这些论文没有被引用。相比之下,最高影响力的会议论文都在普遍方法论方面具有开创性。由此,我们概括,在影响最大的基础方法论方面,美国持续领先中国。在中间水平的研究方面,中国与美国的差距在缩小。而在具体应用的方面,中国发表的会议论文数量则超过了美国。

产业差距拉大

中国活跃的人工智能初创公司数字在2012年之前多于美国,但是在2012年以后被美国超越。如图所示,中国的人工智能创业公司在2012年之前多于美国,但是在2012年以后美国不仅超过中国,且大幅度加速增长。中国人工智能创业公司在2015年以后呈大幅下降趋势;相反,美国方面在2012年之后在人工智能领域活跃的创业公司数量呈现快速上升的趋势。尤其是在2016年之后,中美两国在产业领域的差距进一步加大。2016年之后,美国的人工智能初创公司数量快速上升,在2018年超过600家。在产业领域,中国活跃的人工智能初创公司于2016年超过400家,达到顶峰,然后开始下降,在2018年降至不到200家。(以上趋势由本报告补充腾讯2017年发表的《中美两国人工智能产业发展全面解读》而得出。图7显示风险投资支持的、中美在人工智能领域活跃的创业公司总数的统计。数据来源为投资界网站)

人工智能产业需要长期研发投入,短期很难获得收益。中美两国活跃的创业公司的数量的对比,似乎表明中国在人工智能领域产业的投入后劲不足。这点在腾讯报告中也有提及。我们在这个方面的报告,只是对腾讯报告的补充。

图7 中美人工智能领域创业公司数量对比

Figure 52. Number of startup companies in AI: China vs. US

开源人工智能软件包是人工智能研究,尤其是人工智能应用研究方面的重要基础。国际上多数开源AI软件包都由开发者存放在GitHub软件库中,供从事AI应用方面的研究者使用。本节对比中美人工智能研究者在GitHub软件库中,关注(stare)不同AI软件包的数字,以此作为使用开源AI软件包使用的指数。

2017年以前美国开发者关注人工智能软件包数量要高于中国,2017年以后中国开始超过美国。

图8 中美AI研究者的AI软件包关注总数对比

Number of AI software packages starred by Chinese and US researchers

对比中美应用AI研究者使用开源AI软件包的总体情况。我们对比他们对所有开源AI软件包的关注总数。中国应用AI研究者关注开源AI软件包的数字,在2015年之后经历了快速增长,到2017年中以后,超过了美国。这可能意味着中国研究者在利用中美开发的开源软件包做AI应用研究规模超过了美国。

图9 中美AI研究者关注中美开发的开源AI软件包的对比

Developers of AI software packages starred by Chinese and US researchers

上图将中美两国AI研究者关注的开源AI软件包的开发机构按照国别对比。如图所示,绝大多数中国AI研究者使用的开源AI软件包,都是美国机构开发的,其中使用最多的是Google开发的Tensorflow。整体上,中、美AI研究者关注的美国机构开发的开源AI软件包的数字,相当于他们关注的中国机构开放的软件包的数字的二十几倍。这表明中国研究者在基本算法方面,对美国开源软件包的依赖。

另外,通过人才行业分布对比可知,中国在智能交通、自动驾驶,智能、精准营销,硬件、GPU、智能芯片需求比例要多于美国,而中美两国在算法、机器学习的需求量上要远高于其他领域。

许成钢进一步指出,在人工智能的基本算法、芯片、传感器等方面,中国落后于世界上多数发达国家,除美国外,英国、德国、日本、以色列等国家都领先于中国。美国的AI产业布局非常完善,基础层、技术层和应用层都有涉及,尤其是在算法、芯片和数据等核心领域,具有强大优势,各层级企业数量全面领先中国。中国AI产业在基础元器件、基础工艺等方面差距尤其大。

    责任编辑:田春玲
    图片编辑:蒋立冬
    校对:丁晓
    澎湃新闻报料:021-962866
    澎湃新闻,未经授权不得转载
    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈