人工智能发现:多提后果少提全球,议案更易被美国国会采纳

澎湃新闻记者 虞涵棋 贺梨萍

2017-06-22 22:24 来源:澎湃新闻

字号
未来,美国的国会议员们写了一个议案,没准还会先让人工智能算法打个分。一家美国人工智能公司Skopos近日在《PLOS ONE》期刊上发表论文:输入一份议案原文,外加几个变量,人工智能就能给出该议案通过立法的概率。
根据流程规定,一份议案首先要通过参议院或众议院某个委员会的审议,经该院投票通过,再由两院投票表决。此前,有些研究者也尝试过用算法预测议案在委员会、或在两院之一通过的概率,效果参差不齐。Skopos的联合创始人John Nay目标不限于此:他想要得出一份国会议案通过两院表决、成为法律的概率。
那些想要废除奥巴马医改的议案,算法打了多少分?
Nay收集了从第103届国会到第113届国会(也就是1993年至2015年)的所有立法数据,包括所有议案的全文和其他一些因素,比如共同发起者的人数、议案发起的月份、提起者是否为该院多数党成员等。
Nay使用从第103届国会到第106届国会的数据进行机器学习。所谓机器学习,就是给算法输入大量数据,并给定这些输入值相匹配的输出值,由算法自己“摸索”出输入值和输出值之间隐藏关联的特征。他用经过训练的算法对第107届国会的案例进行了预测。
下一步,Nay又进一步用第103届到第107届国会的数据训练算法,用于预测第108届国会的案例,以此类推。
Nay最终得到的完整版算法包含以下几个部分。首先,算法需要对议案的语言进行分析。通过词汇与周围词汇的嵌入方式,算法得以解读这些词汇的含义。比如,得到“获得教育贷款”这个短语,算法会假定“贷款”这个词和“获得”、“教育”都是相关的,把所有词汇相互之间的关联以量化的形式归纳,由此,每一个词汇就可以用一串数字来代表。结合这些数字,算法就可以理解每个句子的意思。
其次,一个算法试图找到它理解的句子“意思”和议案成功率之间的联系,另三个算法寻找上下文和议案成功率之间的联系。
最后,一个伞形算法综合上述四个算法的结果,预测议案的成功率。
仅仅预测一个议案能否成功没什么价值。大约有96%的议案会失败,也就是说,你每次都猜议案都不通过,也错不到哪里去。因此,更重要的是预测到一个精确的概率值。毕竟,一个国会议案往往会涉及很大的利益,在这种情况下,把议案的成功率上升几个百分点,也是意义重大的。
Nay在论文中提到,他的算法在评估成功率时的表现,比仅仅评估议案能否成功要好上65%。
在国会的案头,想要废除奥巴马医改的议案曾一度堆积如山。这些议案在算法那里拿了多少分呢?虽然,按照平均估计,它们的成功率也只有4%,但算法无情地给所有这些议案打出了更低的概率。
措辞很重要
那么,算法在评估议案成功率时,最重视哪些因素呢?Nay意外地发现,其实议案的文本本身就起到很大的影响。议案发起人属于多数党,以及议案发起人历任多届国会议员固然是个加分项,但对议案成功率的影响不到1%。
而就文本而言,“影响”、“后果”这样的词汇能提升与气候相关的法案的成功率,而“全球”、“变暖”这些词汇只会起到反作用。在与医疗相关的议案中,“公共医疗补助”、“再保险”这样的词并不讨两院议员的欢心。在与专利相关的议案中,看起来众议院讨厌“软件”这个词,而参议院讨厌“计算”这个词。
Nay对此感到惊讶:“我之前以为立法过程主要受党派的影响,政策本身反而不怎么相关。”
这种新鲜的文本分析方法,也让许多政治学家感到眼前一亮。华盛顿大学的John Wilkerson就认为这项研究很有新意,充满前景。
责任编辑:虞涵棋澎湃新闻报料:4009-20-4009   澎湃新闻,未经授权不得转载
关键词 >>

继续阅读

评论(25)

热新闻

澎湃新闻APP下载

客户端下载

热话题

热门推荐

关于澎湃 在澎湃工作 联系我们 版权声明 澎湃广告 友情链接