• +1

美国霸榜ICML,占据3/4被接收论文,中国论文数不到美国两成

2020-06-23 08:39
来源:澎湃新闻·澎湃号·湃客
字号

大数据文摘出品

来源:Medium

编译:木槿

国际机器学习大会是机器学习领域最重要的会议之一,因此观察谁在该会议上发表了文章是一件有趣的事情,所以我看了看2020国际机器学习大会接收的文章,并且分析了参会的作者、机构和国家/地区。

今年从4990篇投稿中接收了1088篇,接收率为21.8%。

在深入研究之前,你可以在GitHub存储库中找到代码,并且可以利用Colab notebook任意绘制图表。

作者

让我们先看看排名靠前的一些作者。

在国际机器学习大会上发表文章是非常困难的,因此更引人注目的是这几位作者在会议上发表了多篇文章。Masashi Sugiyama来自理化学研究所和东京大学,他有高达11篇文章被会议接收。排在他后面的有来自DeepMind的Michal Valko和加州大学伯克利分校的Michael Jordan以及谷歌/阿尔伯塔大学的Dale Schuurmans。

通过把机构参与的文章数量加在一起,可以看到的根据组织发表的文章数量的排序结果。下面节选的是排名前30的机构。

谷歌在该榜单中占据主导地位,大约参与国际机器学习大会发表文章的1/10。

排在谷歌后面的是3家机构:麻省理工大学、斯坦福大学和伯克利大学。Alphabet的DeepMind排名第五。需要注意的是,说Google和DeepMind共发表了114+51篇文章是不正确的,因为其中很多文章是合作完成的,下文还会讨论这个点。

国家/地区

这是很有趣的部分,通过分析作者所在机构和地区的映射关系,我们可以了解哪个地区发表的文章最多。

让我们来看看按国家/地区划分的情况。

美国发表了728篇文章,约占总数的3/4,这是一个巨大的领先优势。

这里还有一个提醒:国家/地区的归属是基于组织的总部,而不是基于作者的位置。因此,如果作者在谷歌苏黎世工作,发表的文章将被计入美国,而不是瑞士。

另一个有趣的现象是,英国和中国发表了差不多相同数量的文章。我们接下来会看到,英国的DeepMind公司发表的文章数量大概占了整个国家的40%。

让我们逐一看一下每个国家/地区的情况,下面图片列出了排名前15位国家/地区的前10名组织(3篇以上文章)。

美国无论是工业界还是学术界,都有大量的机构,并且发表文章数量可观。英国正好相反,以DeepMind公司为首,其次是大学。

中国有强大的机构,华为、阿里巴巴和百度等公司还需努力。在加拿大,几乎所有的大学都发表了文章。

Criteo(法国)是欧洲发表文章数量排名第二的公司。

洛桑联邦理工学院和苏黎世联邦理工学院是瑞士表现最好的学校。

除了美国和中国,大多数顶级文章发表的机构都是大学。全球范围内大学的发表数量是公司的3倍。

在非美国公司中,只有英国(DeepMind)、法国(Criteo)、中国(华为、百度、阿里巴巴)、俄罗斯(Yandex)和韩国(三星)的公司发表了5篇及其以上文章。

合作

通过查看不同组织之间的合作情况,我建立了一个组织之间的合作图,这个图总共有426个节点,1206条边。如果把它绘制出来,我们可以看到这些节点通过边相互连接了起来,你可以在colab notebook中编辑操作。

每一个节点代表着一个组织,节点与节点的连接代表合作的数量。每个节点的大小和颜色取决于发表文章的数量,连线的粗细取决于合作的数量。

如果我们取一个子图,该子图的结点至少有30个合作组织,那么就可以得到一个更吸引人的图。

该图是拥有30个以上合作组织的合作网络子图,其中节点的大小和颜色取决于发表文章的数量,连线的粗细取决于合作的数量。

我还看了一下各个公司的情况。例如,谷歌和麻省理工大学看起来是这样的。

一个很有趣的事情是,谷歌比较感兴趣和大学合作,而不是公司。麻省理工大学则正好相反,有着大量来自业界的合作伙伴。

最后看看每篇文章的作者数量。

大多数文章都是3到4个作者,但一些罕见的情况会有多达15位作者。

两篇文章都有15位作者,比如说文章Stochastic Flows and Geometric Optimization on the Orthogonal Group由谷歌大学、牛津大学、剑桥大学、哥伦比亚大学和伯克利大学的15名研究人员撰写;文章Dynamic Knapsack Optimization Towards Efficient Multi-Channel Sequential Advertising由天津大学、阿里巴巴、清华大学和上海交通大学的15名研究人员撰写。

通过统计每篇文章参与的机构数量,可以得到下图:

最常见的是一篇文章由一个或者两个机构合作完成,但是有些文章却由7个机构合力完成。

有两篇文章来自7个不同组织的作者,第一篇是How Good is the Bayes Posterior in Deep Neural Networks Really?,由Google、微软、华沙大学、阿姆斯特丹大学、加州大学欧文分校、苏黎世联邦理工学院和伦敦帝国理工学院合作完成;第二篇是Learning to Navigate in Synthetically Accessible Chemical Space Using Reinforcement Learning,由99andBeyond、蒙特利尔大学、IIIT Hyderabad,麻省理工大学,Mila,特拉华大学和LinkedIn合作的项目。

想说的都说完了,我想你们应该对发表最多文章的作者,组织和国家/地区有了很多的了解,但是我敢打赌,你肯定还有很多的想法和问题,评论区一起聊聊。

相关报道:

https://medium.com/criteo-labs/icml-2020-comprehensive-analysis-of-authors-organizations-and-countries-c4d1bb847fde

原标题:《美国霸榜ICML!占据3/4被接收论文,中国论文数不到美国两成》

阅读原文

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    收藏
    我要举报
            查看更多

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2026 上海东方报业有限公司