美国发布最全冠状病毒论文数据库,可助科研人员快速梳理文献

澎湃新闻记者 王心馨

2020-03-17 14:28 来源:澎湃新闻

字号
现在,只要登录一个网站,你就可以获取超过24000份关于冠状病毒的研究文献。这对于正在研究新冠病毒的科学家来说,是一个省事又省力的好工具。
当地时间3月16日,美国多家研究组织人员联合发布了关于冠状病毒的开放研究数据库,该数据库的论文来自同行评审期刊,非同行评审的预印本论文网站bioRxiv和medRxiv等。目前,这个数据库涵盖了SARS-CoV-2(新冠病毒),Covid-19(该疾病的科学名称)和冠状病毒组等多方面内容。也就是说,这个数据库几乎包含了与新冠病毒相关的最全科学文献。同时,这个数据集还能实时更新,发布更多的研究论文。
据了解,该数据库是在美国白宫科学技术政策办公室(OSTP)的要求下,通过三个组织之间协作而完成的。其中,美国国立卫生研究院的国立医学图书馆(NLM)提供了对现有科学出版物的访问权限;微软则利用其文献策划算法来帮助查找相关论文;非营利组织艾伦人工智能研究所(AI2)提供了可将研究论文从网页转换为PDF格式的算法处理能力。目前,该数据库可以在AI2的Semantic Scholar网站上找到。
Semantic scholar跟谷歌学术搜索功能类似。它是AI2结合了自然语言处理和计算机视觉的新学术搜索引擎。但相比谷歌学术搜索,Semantic Scholar更加精确,简洁明了,它的搜索结果会显示关键信息,例如作者,方法,数据和引文,使科学家可以更轻松地快速评估每篇论文。
值得一提的是,AI2还使用ELMo和BERT等最新的自然语言模型来描述论文之间的相似性。同时,该数据库还有一项新功能,可以帮助研究人员,根据自己的兴趣创建个性化的研究摘要。
对于科学家来说,他们正在争分夺秒地研究新冠病毒,以期找到阻止其传播的方法和治疗方法。有了这个数据库后,所有研究文献将集合在一处,可以让研究人员利用自然语言处理算法更轻松地挖掘文献资料。 OSTP也公开呼吁人工智能的研究人员开发用于文本和数据挖掘的新技术,称这将帮助医学界更快地梳理大量的研究信息。
(本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP)
责任编辑:李跃群
校对:施鋆
澎湃新闻报料:4009-20-4009   澎湃新闻,未经授权不得转载
关键词 >>

相关推荐

评论(15)

热新闻

澎湃新闻APP下载

客户端下载

热话题

关于澎湃 在澎湃工作 联系我们 广告及合作 版权声明 隐私政策 友情链接 澎湃新闻举报受理和处置办法 严正声明