澎湃Logo
下载客户端

登录

  • +1

人工智能可以理解“他她它”吗?

2020-12-28 12:43
来源:澎湃新闻·澎湃号·湃客
字号

文/陈根

具有代替和指示作用的代词,作为实词在句法和文本中具有重要作用。代词令语言简洁且更富有变化性。

对于人类来说,识别代词指代对象并不算困难,凭借对上下文和对句子的理解就可以找出代词的指代对象。然而,对于人工智能来说,却并不容易——机器对文本的理解通常需要核心性解析。换言之,能否准确搜索、追踪、分析代词与实体之间的关联,对于人工智能能否准确理解文本内容至关重要。

这种能力被称为共指消解(Conference Resolution),是自然语言处理(NLP)领域的重要研究方向,即通过追踪长句、段落、文章中的代词,找到其对应的指代对象或内容。

尽管目前有很多体量庞大的众包数据集,但它们主要考察模型理解局部语义以及谓词参数结构,涉及共指消解的问题很少见。

针对这一问题,艾伦人工智能研究所的研究团队最近公布了一个新的众包数据集,被称为为 QUOREF,里面包含超过 2400 个广度选择问题,旨在专门考察模型的共指消解能力。这些问题需要在维基百科的 4.7K 多个英文段落中分析并找到各个实体的指代对象。

作为专门测试共指消解能力的数据集,QUOREF 足以证明目前常见的机器阅读理解模型仍有很大的进步空间。通过分析错误答案背后的原因,NLP研究者才能更好地改进模型,实现在复杂、多元、大跨度的文本内容中准确对应实体与代词,做到真正意义上的的语义理解。

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈