澎湃Logo
下载客户端

登录

  • +1

数据周报之美国大选

2020-06-02 18:45
来源:澎湃新闻·澎湃号·湃客
字号

原创 服老思和同学们 P话

这是 pwords 的 36 次数据周报

再过不到半年,我们将迎来美国 2020 的总统选举。

本次选举受到全世界极高的关注。中美贸易战彻底撕开,疫情严重冲击经济,美国多地大规模示威,都增加了许多不确定性。

为了帮助更多朋友了解这次选举,我们准备了这次的专题数据周报,历时约一个月,整理了超过 100 篇主流媒体报道、学术论文、专家博客,涵盖信息图、民调动态、大选综述、2016 覆盘、网络分析、文本分析、地图制作等各方面。

下面,就让我们从数据的角度来看看这场即将到来的大选。

全文共 15000 字,阅读大约需要 30 分钟。

#1. 2020 综述

美国总统竞选流程

2020 年 11 月,民主党和共和党候选人将竞逐总统之位。根据美国宪法规定,美国总统选举主要分为五个阶段:党内预选、党内候选人提名、竞选活动、全民投票、选举人团投票,历时接近 1 年。

美国总统选举流程介绍 来源:https://www.usa.gov/election

各党派竞选人

根据美国宪法规定,总统必须年满 35 岁、在美国出生,并且在美国居住至少 14 年。

民主党和共和党是美国两个主要政党,总统将会从两党派的候选人中决胜出。

来源:网络

党内初选

美国大选的第一步即党内初选,即各政党决定选举出一位提名人。

美国的党内初选主要分成六类:封闭式、半封闭式、开放式、半开放式、综合式以及二轮决选制,主要区别在于是否允许弱党派和独立人士参与以及允许的参与程度。每个州党内初选的制度都有区别,地方可以制定自己的选举法规,选择自己的选举日期。

2020 年大选,共和党内方面特朗普寻求连任,由于党内缺乏有力的竞争者,加之其党内支持率极高,所以今年的共和党将会派出特朗普继续出战。

而民主党方面,党内有超过 20 名民主党人争取党内提名。

民主党内支持率较高的候选人有拜登、桑德斯、沃伦。其中拜登是美国前副总统,曾参加 1988 年和 2008 年两届美国总统选举,但均未获得提名。桑德斯也曾在 2016 年以民主党人身份参与角逐总统选举,但最终败给希拉里。沃伦是民主党内民调支持率最高的女性竞选人,主张对华盛顿进行“重大的结构性改革”,其民调支持率在去年一直稳居前三,其于 2020 年 3 月 5 日宣布退选。

对于民主党党内候选人来说,今年 3 月 3 日,也就是“超级星期二”至关重要。美国许多州、行政区、管区在这天举行民主党初选。这意味着在 24 小时内,整个美国大约会开出三分之一的党代表票,这些票数将在很大程度上决定党内初选的最终结局。这是竞选人可以获得最多党代表票的一天。此次“超级星期二”之后,拜登超前,其他民主党候选人相继退选。自 2 月 3 号第一场民主党内初选选战正式打响,直到 4 月 8 日桑德斯宣布退出初选,拜登正式被提名为民主党候选人。

民主党和共和党各候选人获得的党代表票数(截止 5 月 23 日)

https://en.wikipedia.org/wiki/Primary_election#Primaries_in_the_United_States

https://zh.wikipedia.org/wiki/%E5%88%9D%E9%81%B8#%E5%88%86%E9%A1%9E

2020 年民主党内初选各州情况

https://www.nbcnews.com/politics/2020-presidential-election

2016 年民主党内初选各州情况 黄:希拉里 绿:桑德斯

选举人团制度

根据美国选举制度,美国总统最终由选举人团,而非由选民直接选举产生。各州选民投票给支持的总统候选人,同时投票选出参加两党全国代表大会的代表。各州的两党根据选民投票结果为各总统候选人分配党代表票数,党代表须承诺支持指定的总统候选人。绝大多数州和华盛顿特区均实行“胜者全得”规则,即把本州或特区的选举人票全部给予在本州或特区获得相对多数选民票的总统候选人。全国选举人票为 538 张,按照规定,总统候选人需要获得至少 270 票才能当选。

相关链接:https://zh.wikipedia.org/wiki/%E7%BE%8E%E5%9B%BD%E9%80%89%E4%B8%BE%E4%BA%BA%E5%9B%A2

特朗普和其他美国总统的同期支持率对比

和其他总统同期支持率对比可以看到,相比往届总统,特朗普民众支持率都偏低。从相对趋势来看,大多数总统任期内的民调会有大幅度的波动,呈大规模下降趋势;对比来看,特朗普的民调波动浮动较小,整体较平稳,且呈现上升趋势。

特朗普和其他美国总统的同期支持率对比

https://projects.fivethirtyeight.com/trump-approval-ratings/

相比前任,民调显示特朗普并不令美国民众满意。虽然其在共和党内的满意度很高,但在民主党和独立党派的民众中,其满意度都低于其他总统。

2018 年 7 月和 2019 年 12 月特朗普民调和其他总统任期内民调对比

2018 年 7 月和 2019 年 12 月特朗普民调和其他总统对比(按党派)

https://fivethirtyeight.com/features/trump-may-be-even-more-unpopular-than-his-approval-rating-shows/

特朗普任期内支持度

特朗普四年任期内的民调水平相对较平稳。考虑全球疫情爆发这一重要因素,单看自三月份以来,特朗普的支持率并未受到太大影响,反而在 3 月有过一些正向波动。但同时我们也要考虑到,其近一个月的支持率有所回落,呈下降趋势。但整体来看,特朗普目前的支持率仍属于任期内的中偏上水平。

特朗普民众支持率变化 来源:FiveThirtyEight

经济

美国的经济发展是影响特朗普支持率的重要因素。在其任期的前三年,美国经济整体向好。特朗普前三年民调一直保持平稳,且整体呈上升趋势,美国经济向好或许也是其中的重要原因,选民大多认可其经济和外交政策。但现在受疫情的影响,美国经济收缩,失业人数攀升,特朗普复苏经济举措以及成效也很关键,将会很影响其十一月大选的支持率。(选举很重要的是选民对于选举人的信心,特朗普前三年的经济措施建设了选民对于其经济制裁的信心,但疫情爆发这样的特殊情况,他的行为将会更加关键,是否能让民众继续信任?这也很重要)

对比奥巴马和特朗普总统期间美国的失业率,截止 2019 年,美国失业率从 2016 年末的 4.7% 持续下降至 2019 年的 3.7%。

美国近十五年失业率(灰色部分为奥巴马任期) 来源:https://www.washingtonpost.com/business/2019/08/20/trump-v-obama-economy-charts/

但同时,2020 年的新冠疫情,极大影响了美国的失业率。下面“是否连任和美国失业率变化“的关系图,过往总统选举数据表明,要获得竞选连任失业率非“下降”不可(见图中左半部);而目前,美国失业率纪录从4%飚升到25%,超过 20% 的升幅。在失业率上升的情况下,暂时还没有连任的案例。

美国总统任期前后失业率变化 来源:https://twitter.com/CapEconMarkets/status/1257584139978641408

从美国道琼工业指数来看,特朗普任期内其稳定增长。

美国近二十年道琼工业指数 来源:https://www.bbc.com/news/world-45827430

考虑美国的经济结构以服务业为主,下面展示了美国 ISM 非制造业指数近十年的变化。ISM 非制造业指数主要追踪美国非制造业活动情况,是重要的经济指标之一。特朗普任期内,ISM 非制造业指数整体水平上升。从最近的指数变化可以看到,指数在疫情爆发后直线下跌。

美国近十年美国 ISM 非制造业指数 来源:https://tradingeconomics.com/united-states/non-manufacturing-pmi

疫情影响

从下图可以看出,民众对于特朗普政府处理疫情的方式并不满意,但 3 月民调较为平稳,从 4 月开始,随着美国本土以及世界范围内疫情的加重,支持率明显持续下降,不支持率持续上升。

美国民众对于特朗普政府疫情相关举措的支持率变化

从下图可以看出,接近 6 成美国民众对疫情对经济的影响持非常担忧的态度,3 成民众部分担忧。上升的担忧情况主要爆发在 3 月,从 4 月开始,民众的担忧保持在稳定的状态,没有明显的下滑和上升。

美国民众对经济受疫情影响的担忧变化

从下图可以观察到不同党派人士对特朗普政府举措的满意程度变化。美国疫情爆发以来,除民主党人士对其支持率下降之外,共和党和独立党派人士对其满意程度并没有明显变化,甚至在三月末有上升趋势。由此我们可以猜测,其党内支持率并没有受到太大影响。但可以看到,自 4 月中以来,各党派人士对其支持率都有缓慢下降的趋势。

美国民众对特朗普的满意度变化(分党派)

https://projects.fivethirtyeight.com/coronavirus-polls/

民调方法解释:https://fivethirtyeight.com/features/how-were-tracking-donald-trumps-approval-ratings/

拜登和特朗普的民调比较

目前根据 Real Clear Politics 的民调可以看到,近五个月拜登的支持率基本稳定高于特朗普五个百分点左右,相对较平稳。相比 2016 年同期,希拉里和特朗普之间民调差距的波动更大更不稳定,两党派候选人的民调差距也更小。

但由于总统大选中的黑天鹅事件往往会造成很大的影响,譬如 2016 年希拉里的邮件泄漏事件。拜登目前唯一的丑闻是五月份的“性侵”指认,但由于事件本身证据单薄,加之疫情吸引了民众更多的注意力,事件似乎并没有对其民调造成很大影响。但现在离总统大选最终投票还有半年左右,所以很难预测之后是否有其他黑天鹅事件发生。

另外一个重要的变化是,在 2020 年之前,可以看到民众对于拜登和特朗普的支持率是此消彼长,这一点在 2016 年总统大选中也很明显。但在 2020 年之后,民调对于两位总统候选人的支持却近乎同步,升降趋势大体一致,总体降低。是否可以猜测,民众对于选举的关注性降低。这也为今年大选结果增加了更多的不确定性。

2020 年拜登 & 特朗普 Real Clear Politics Poll Average 指数变化对比

2016 年希拉里 & 特朗普 Real Clear Politics Poll Average 指数变化对比

美国人对 2020 年大选的新闻关注远不及疫情

Pew Research Center 在 4 月 20 日至 26 日进行的一项调查发现,当美国大选遇上疫情,媒体和民众的关注度更多放在后者,这也为今年的大选结果增添了更多的不确定性。

https://www.pewresearch.org/fact-tank/2020/05/22/americans-are-following-news-about-presidential-candidates-much-less-closely-than-covid-19-news/

摇摆州

自 2000 年以来,大多数州在美国大选中都投票支持同一党,所以这些州常常被认为是坚定的民主党票仓或共和党票仓。而剩下那些没有一个单一政党拥有压倒性支持度以取得选举人票的州被称为“摇摆州”。

下图中,深蓝色的州为坚定的民主党票仓,浅蓝色为偏民主党的州;深红色为共和党票仓,浅红为偏共和党的州;黄色则为摇摆州。

美国各州政治倾向划分 来源:https://www.ft.com/content/6395f321-1390-4d50-9607-b0c7f629925e

摇摆州通常是大选的关键,根据民调数据,目前除北卡罗来纳民调显示特朗普支持率高于拜登外,在其他各摇摆州,拜登支持率高于特朗普。但考虑到 2016 年在各民调均显示摇摆州希拉里民调高于特朗普的情况下,民主党却以细小差距失掉大多数州,所以对于民调结果依然要保持辩证态度看待。

摇摆州的选民近期民调变化

更进一步,根据 FT 报道,2016 年到 2020 这四年间,几个摇摆州的选民越来越多样化。浅蓝色代表整体来看全国选民的变化,深蓝色为对应州的选民变化。

美国各摇摆州疫情:

摇摆州因疫情死亡人数及预计死亡人数 来源:FT

从美国 4 月份的失业率来看,摇摆州的就业率不乐观,这或许也将对两位候选人在摇摆州的支持率带来一些影响。

美国各州 4 月失业率(红色标注为摇摆州) 来源:https://www.bls.gov/web/laus/laumstrk.htm

美国各摇摆州失业率变化 来源:FT

从 GDP 角度看,预计美国第二季度 GDP 将下降 29%,而大多数摇摆州的 GDP 下降幅度高于全国平均水平。摇摆州不稳定的经济状况也并不利于现任总统在各州的支持度。

美国各摇摆州第二季度预计 GDP 收缩情况 来源:FT

2016 年和 2020 年民主党内初选选举情况对比

随着桑德斯的退出,拜登成为民主党唯一候选人,将代表民主党参加 2020 年的美国大选。比较 2020 年和 2016 年的民主党各州初选结果,同时比较分析三位现在/曾经的民主党候选人 ---- 希拉里、桑德斯和拜登在不同地区和群体间的优势。可以看到,大片玫红色区域代表 2016 支持希拉里,2020 年支持拜登的区域。橙色代表 2016 年支持桑德斯而今年转而支持拜登的区域。

https://fivethirtyeight.com/features/how-is-joe-biden-remaking-the-2016-primary-map/

#2. 社交媒体

关注奥巴马的成年美国推特用户比关注特朗普的多

Pew Research Center 通过分析,估计在美国大约 19% 的成年推特用户关注特朗普。而约有 26% 关注奥巴马。由于推特是国际性平台,且存在僵尸账号,所以 Pew Research Center 基于对 2388 位使用推特的美国成年人的代表性样本计算。

分党派来看,民主党议员的追随者普遍远高于共和党议员的追随者,可以由此推测,民主党在推特上更有影响力。

奥巴马和特朗普推特追随者数量统计

https://www.pewresearch.org/fact-tank/2019/07/15/about-one-in-five-adult-twitter-users-in-the-u-s-follow-trump/

六成特朗普推特追随者非活跃用户?

根据 2018 年 10 月 SparkToro 的分析,特朗普的推特追随者中超过60%的帐户(约3,300万个帐户)被认为是假账号。SparkToro 基于机器学习的工具分析了特朗普的所有追随者,发现其中很多账户很有可能是伪造账号。

这一情况同样出现在其他总统的推特账号上,且都不低。

https://qz.com/1422395/how-many-of-donald-trumps-twitter-followers-are-fake/

美国人对 2020 年大选的新闻关注远不及疫情

Pew Research Center 在 4 月 20 日至 26 日进行的一项调查发现,有 52% 的美国人对 2020 年选举候选人的新闻相当关注,相比 2 月的调查数字 59%,大家对选举候选人的关注有所下降。在 2016 年 4 月,有 69% 的美国人表示他们相当关注选举候选人新闻,这一数字远高于 2020 年民众选举的关注。

调查发现,87% 的调查者表示,他们非常关注疫情相关信息消息。当美国大选遇上疫情,媒体和民众的关注度更多放在后者,这也为今年的大选结果增添了更多的不确定性。

调查同样显示,男性、年龄较大和大学学历以上的人,更加关注 2020 选举。

https://www.pewresearch.org/fact-tank/2020/05/22/americans-are-following-news-about-presidential-candidates-much-less-closely-than-covid-19-news/

数据显示推特用户对特朗普推文的参与度降低

2019 年 7 月,Quartz 对特朗普的个人推特帐户数据进行的分析显示,自 2019 年初到七月,特朗普推文的参与度直线下降。

2017 年到 2019 年七月特朗普推文的参与度变化

https://qz.com/1665059/data-show-trump-is-right-fewer-people-like-his-tweets-now/

记者和特朗普支持者在推特上“脱节”

MIT Media Lab 通过分析社交媒体公司提供的完整数据集发现,在推特上,特朗普的支持者在大选期间谈论政治时组成了一个孤立的团体,他们与克林顿的支持者或主流媒体之间没有什么联系。也就是说,特朗普的支持者有自己的信息来源,而非主流媒体,所以主流媒体的信息很观点很难影响他们。相比之下,希拉里的支持者和记者之间在推特伤的联系更紧密。这也可以再次解释,2016 年在主流媒体都支持希拉里的情况下,特朗普最终胜利的原因。

研究者在最后也表明,由于分析的数据来源于推特这一单一社交媒体,并不一定能代表美国的整体情况。

相关阅读:��老文存档 | 据说,未来的城市长这样

https://www.vice.com/en_us/article/d3xamx/journalists-and-trump-voters-live-in-separate-online-bubbles-mit-analysis-shows

新闻媒体如何在选举中报道特朗普和克林顿

作者分析 2016 年美国总统选举前两个月中来自美国排名前 53 位的新闻媒体机构的超过 12,000 条有候选人图片的 Facebook 帖子,探究媒体如何报道两位候选人。

可以看到,带有特朗普图片的帖子明显多于希拉里,也就是说,一定程度上特朗普得到了更多的媒体曝光度和关注度。

https://pudding.cool/2017/03/elections/

推特的回音室效应

本研究考察了 2016 年美国总统大选在Twitter上的“回音室现象”。使用网络分析和“大数据”分析来分析特朗普和希拉里超过5000万条推文。结果表明 Twitter 社区上有关特朗普和克林顿在政治上的同质性和舆论领导力都有很大的差异,这其中,推特上的意见领袖在回音室效应上起到了很大的作用,他们负责创造较为同质化的推特社群。

根据作者研究,与希拉里相关的十大推特意见领袖主要都是新闻机构或媒体专业人员,其中 WikiLeaks 的影响力仅次于希拉里本人的官方账号,这可能简介证明 WikiLeaks 事件在希拉里选举失败中占到的重要位置。而特朗普相关的意见领袖,更换频繁得多,基本每周会更换一次,其中经常出现的人包括特朗普本人的官方账号以及 CNN 等。其中十大最经常出现的意见领袖中,六位来自右派的媒体组织,其中大多数是新闻记者。统计分析还显示,以右派的意见领袖在推特社区有关特朗普的影响力比希拉里更具影响力。

最后作者总结:

当前批评回声室效应还为时过早,因为当前有关其的批评通常忽略网络讨论中发现的细微差别。我们的发现表明希拉里和特朗普的 Twitter 网络有很大的不同,不同的意见领袖都对 Twitter 社区的网络性质做出了不同贡献,很难得一个笼统结论。这项研究的结果揭示双方 Twitter 网络的细微差别,并希望大家对 Twitter 网络以及意见领袖如何参与回声室效应进行更谨慎的研究。

https://www.researchgate.net/profile/Lei_Guo23/publication/326525655_Who_is_responsible_for_Twitter%27s_echo_chamber_problem_Evidence_from_2016_US_election_networks/links/5c3c923e299bf12be3c6bdd8/Who-is-responsible-for-Twitters-echo-chamber-problem-Evidence-from-2016-US-election-networks.pdf

分析社交网络对 2016 年共和党初选的影响

作者通过分析推特数据和 Reddit 论坛数据,通过情感分析,分析选民对共和党内初选选举人的态度,以及在 Reddit 论坛上与不同选举人相关议题的不同侧重。

http://snap.stanford.edu/class/cs224w-2015/projects_2015/Analysing_Social_Network_Reactions_to_2016_Republican_Primaries.pdf

Twitter 意见趋势与民意调查汇总:希拉里 vs 特朗普

主要介绍了通过对推特信息进行自然语言分析等处理研究推特上有关选举的意见趋势,并与传统民调之间的吻合性进行对比,探讨一种可在社交媒体时代使用的,结合社交媒体分析的民调方法。

https://www.nature.com/articles/s41598-018-26951-y.pdf

推特上的俄罗斯假账号

作者利用 NBC 新闻发布的超过 200,000 条推文的数据库,研究 2016 美国大选背后与俄罗斯有关的恶意账户。

他们发现这些账户大多创立于 2013 年,最常见的推文内容包括黑人、警察等。而 2016 年一些实时热点的讨论高峰都与这些假账号有关。

作者总结:

这些伪造的帐户通常通过名称伪装成 1)普通美国人,2)具有大都会名称的新闻网站或,3)带有相关主题(例如政治和宗教信仰)的国际名称;他们通过在诸如丑闻和大型公告发生的周末等发布主观性较强的推文来实现影响其他 Twitter 用户对于事件的看法。同时,他们擅长使用推特的趋势标签进行宣传,从而增加了其他 Twitter 用户对于相应事件的关注。

https://towardsdatascience.com/russian-fake-tweets-visualized-6f73f767695

数据链接:https://www.nbcnews.com/tech/social-media/now-available-more-200-000-deleted-russian-troll-tweets-n844731

#3. 2016 回顾

1896 年纽约时报首张选举地图

根据 Matthew Ericson 的分享,纽约时报首张选举地图发表于 1896 年 11 月 4 日。

1896 年纽约时报首张选举地图

http://www.ericson.net/content/2010/11/first-nyt-election-map/

2016 美国大选预测哪里出了错?

作者认为,导致大部分预测结果出错的其中一个重要原因是 2016 年大选中社交媒体在吸引选民方面发挥了重要作用。

•特朗普从其”数字优先“的策略中极大获益。

•预测选举本身非常困难,因为影响结果的变量往往很多,且变化率高。

•在方法上,从传统选举中积累的经验和参考数据不再那么适用于 2016 年的选举。未来的选举预测需要结合大数据并改进预测方法,从而提高预测结果的准确性和及时性。暂时还没有足够的历史数据可以可靠得将社交媒体数据纳入统计考虑。

https://link.springer.com/article/10.1057/s41270-016-0010-2

谁会成为美国总统?

作者 Nate Silver 是有名的总统选举预测专家。2008 年,他预测的 50 个州中的 49 个是正确的;2012 年,他的 50 个预测全部准确。然而在 2016 年,知道选举结果公布前,Nate 都表示 Trump 仅有不到 30% 的成功率。在 2016 年,他错选了 5 个州,导致大约 70 票的选票错位。

https://projects.fivethirtyeight.com/2016-election-forecast/

2016 年实时选举预测 -- 纽约时报

每年美国大选,媒体及民间机构都会实时预测大选结果,追踪最新的民调动态。

https://www.nytimes.com/elections/2016/forecast/president

哪些因素会左右 2016 美国大选?

下面的作品来自 FiveThirtyEight,2016,FiveThirtyEight 凭借这一作品获得 Data Journalism Awards 中的 “News data app of the year (large newsroom) ”。作品中各图表间的变量相互关联,读者可以通过自行更改变量查看因素对于不同州结果以及最终选举结果的影响。

https://projects.fivethirtyeight.com/2016-swing-the-election/

选区边界划分对结果的影响

来自 FiveThirtyEight 的作品。2018 年获得了由全球编辑网(Global Editors Network,GEN)发起和组织的数据新闻 --- 年度新闻程式奖(Data Journalism Awards,DJA)。美国选区划分对于选举结果的影响一直饱受争议,如果采用不同的选区绘制方式,大选结果会有怎样的变化呢?作品尝试了另外七种划分选区边界的方法,探讨在选民投票意愿不改变的情况下,对地区边界的更改如何从改变美国众议院的党派和种族组成。读者可以选者从宏观角度看全国情况,也可以选择观察不同州的具体变化。

作品按照七个目标进行选区划分:

1.现有国会选区划分模式

2.“共和党占优”模式

3.“民主党占优”模式

4.使选民的党派细分与选民相匹配

5.提高选举竞争模式

6.最大化少数族裔地区的数量模式

7.优先考虑选区区域紧凑模式(使用算法)

8.遵循县边界同时尽量使区域紧凑模式

左图为“共和党占优”的选区划分;右图为“民主党占优”的选区划分

作品背后使用的方法比较复杂,设计大量绘制和分析工作,作者团队也专门写文章进行了详细的解释,感兴趣的朋友可以移步 https://fivethirtyeight.com/features/we-drew-2568-congressional-districts-by-hand-heres-how/ 进行进一步研究。

https://fivethirtyeight.com/features/we-drew-2568-congressional-districts-by-hand-heres-how/

https://projects.fivethirtyeight.com/redistricting-maps/

由于美国大选采用“选举人团制度”,选区的划分有时起到至关重要的作用。路透社的报道简单介绍近年几个更改选区划分的案例,解释重新划分的选区怎样影响最终的党派结果。

https://graphics.reuters.com/USA-COURT-GERRYMANDERING/010091701PF/index.html

图表怎样误导观众?

左边为实际地图,右边为按人口扭曲的变形地图(Cartogram)。左上角为典型的大选结果地图(为考虑不同州的人口密度);右上角通过缩放州的大小使各州面积与选举票数成正比来表示选举结果。左下角为更为细分的县级图;右下角为根据各州人口调整后的结果地图。

可以看到,对地图进行不同的处理,产生的视觉效果也有很大的不同。

http://www-personal.umich.edu/~mejn/election/2016/

下面是一个“特朗普如何使用柱状图误导观众”的案例。图像中的亮色区域为特朗普使用的结果图片,作者根据比例补全完整的柱状图,可以看到,在很多张图片中,特朗普团队为了突出结果的差异性,使用截图,从而误导观众。但搞笑的是,在一部分柱状图中,特朗普本来获得更多的优势,反倒被弱化了。

https://www.washingtonpost.com/graphics/politics/2016-election/trump-charts/

美国选举地图

动态展示了 1960 到 2016 年美国选举地图,可以看到 50 年来红蓝两党的变化,地图精确到县。

https://vanderbei.princeton.edu/JAVA/election2016/

特朗普的推特

纽约时报统计特朗普自 2017 年的共 11000 条推文,对推文内容进行统计分析。他最常发推文的主题是什么?根据统计,特朗普共发过 5889 条抨击他人的推文,其中 4469 条 针对民主党、调查机构和新闻媒体,851 条针对少数群体。

https://www.nytimes.com/interactive/2019/11/02/us/politics/trump-twitter-presidency.html

Podesta Emails

2016 年 3 月,民主党候选人希拉里美国总统竞选主席 John Podesta 的个人电子邮件造成数据泄露。WikiLeaks 随后获得了部分 Podesta 电子邮件,并于于 2016 年10 月 和 11 月发布了20,000页电子邮件。这场信息泄漏被认为在一定程度上导致了希拉里在选举中的失败。

Podesta Emails 是一个 2016 年大选中的关键事件,使一些支持者离开了希拉里。现在,麻省理工学院的 ClintonCircle 项目已经无法访问,但是还是可以通过其它方式搜索到一些摘要。

2016 年 6 月 1 日 - 11 月 8 日 Google Trend 趋势 来源:https://fivethirtyeight.com/features/wikileaks-hillary-clinton/

相关链接:

https://web.archive.org/web/20161107065550/https://clinton.media.mit.edu/

数据源wikileak: https://web.archive.org/web/20161107184300/https://wikileaks.org/

Co sponsorship

所有网络都是使用 Fruchterman-Reingold 力导向算法绘制的有向图。通过同一法案发起人和共同发起者作为中间联系,连接不同的议员。其中每个点代表一名参议院/众议员议员,民主党以蓝色显示,共和党以红色显示,独立人以绿色显示,其他人以灰色显示。

议员之间边的权重计算,使用了 Gross,Kirkland 和 Shalizi 提出的 "relative weighted propensity to cosponsor" (WPC) ,即根据每个议案支持人数做的加权平均。 众议院的图表仅展示 WPC ≥ 0.45 时的关系,参议院的图表仅在 WPC ≥ 0.15 时的关系。

可以从图表的疏密程度看出美国两党间关系的变化。

Co sponsorship of bills showing the trend of two parties political polarisation

https://f.briatte.org/parlviz/congress/plots.html

#4. 民调资源

民调,根据维基百科的介绍:

是一种了解公众对某些政治、经济、社会问题与政策的意见和态度,由专业民调公司、媒体或是政府单位进行的调查方法,其目的在于通过网络、电话、或书面等媒介对大量样本的问卷调查抽样,来尝试在统计学上较为客观、精确地推论社会舆论或民意动向。

最早的民调可以追溯到 1824 年的总统选举,哈里斯堡宾州人报(The Harrisburg Pennsylvanian)询问路过的行人要投票给哪位候选人。

民意调查涉及多个方面:问题涉及、样本选择、抽样数量、对误差的解释等。由于各家民调机构的设计和解读有所不同,这也导致结果会有区别。除了具体的民调设计会影响结果,民调机构的政治倾向和背景也是影响结果的重要因素。

民调类型:

•普通民调

•汇总型民调

汇总型民调机构

三个大的机构会定期公布各种民调的平均值,采用的方法都是汇总各州和联邦范围的各种民调结果,但选取的数据源和计算方法会有一些区别,导致结果也不会不同。感兴趣具体计算方法的朋友可以去官网研究。

最近三大机构也实时公布有关美国大选的各项民意调查结果。

Pollster

2006 年成立的一家民意调查汇总站,由 HuffPost 运营。

调查方法解释:https://elections.huffingtonpost.com/pollster/faq

倾向

•其背后的Huffingtonpost 本身政治左倾

•Pollster现在是 Verizon Media 的一部分

https://elections.huffingtonpost.com/pollster

Real Clear Politics

RealClearPolitics 于2000年由 Tom Bevan 和 John McIntyre 创立。如今,RealClearPolitics 已从发展成为一家综合性媒体公司– RealClear Media Group,并提供包含情报、军事、调查性新闻等内容。其中最著名的依然是民调相关的内容。

链接:https://www.realclearpolitics.com/epolls/other/president_trump_job_approval-6179.html

计算

通过收集各种民调计算 RCP Average。

链接:https://www.realclearpolitics.com/epolls/2020/president/us/general_election_trump_vs_biden-6247.html

倾向

•“媒体偏向分析”网站查询,民调 Real Clear Politics 的倾向偏右。

•网站创始人之一 McIntyre 发表过右倾的言论和看法(十几年前的事情)

•在2008年美国总统大选期间,《华尔街日报》多次将RealClearPolitics称为“无党派”。纽约时报在其报道中也称该网站为“无党派”。

来源:https://en.wikipedia.org/wiki/RealClearPolitics

偏向分析查询网站:https://mediabiasfactcheck.com/real-clear-politics/

FiveThirtyEight

FiveThirtyEight 是一个专注于民意测验分析,政治,经济学和体育的网站。其现任主编为 Nate Silver,其因在 2008 年和 2012 的选举预测为人熟知。2013年7月,ESPN 收购了FiveThirtyEight;2018年被 ABC News 收购。

FiveThirtyEight 启动“不赞成”特朗普的等级跟踪。根据官方对于数字的来源解释:

我们使用能找到的所有民意调查(只要我们认为它们是真实的科学调查)。同时我们使用了根据民意测验等级对民意测验加权的公式,该等级基于民意测验者自1998年以来预测选举的历史准确性以及一对易于衡量的方法论检验。

倾向

•根据媒体倾向核查:轻微左倾

•母公司 ABC News 政治倾向左倾

https://projects.fivethirtyeight.com/trump-approval-ratings/

方法解释链接:https://fivethirtyeight.com/features/how-were-tracking-donald-trumps-approval-ratings/

参考链接:https://www.dw.com/zh/%E4%B8%93%E8%AE%BF%E5%A6%82%E4%BD%95%E7%9C%8B%E6%87%82%E7%BE%8E%E5%9B%BD%E5%A4%A7%E9%80%89%E6%B0%91%E8%B0%83/a-19550518

CREDIT

•写作:@包小包

•编辑:@服老思

•排版:bee

数据科学 | 数字广告 | 未来主义

原标题:《数据周报之美国大选》

阅读原文

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈