澎湃Logo
下载客户端

登录

  • +1

看了946条辟谣信息,我们提炼出一些信息辨别方法

2020-02-17 20:26
来源:澎湃新闻·澎湃号·湃客
字号

“刚接通知,定于今晚12点对全市主干道进行大面积消杀、消毒工作。因此次消毒药水浓度较大,请各位今晚10点后务必呆在家中……”

“水厂的朋友来电告知,非常时期,自来水中在允许的范围内加大了氯气的注入,水静置两小时以上再用……”

疫情期间,上述信息出现了全国各地版本,特殊时期公众对信息更为渴求,在信息的海洋中,普通公众又该如何有效鉴别信息呢。我们爬取了“微博辟谣”平台于1月20日至2月11日间发布的与新型冠状病毒肺炎相关的全部微博共804条,删除重复、拆分合集后共946条(下称“相关微博”),其内容涉及被判定为谣言的内容以及辟谣信息,我们从内容分类、发布主体、呈现形式等维度进行编码、分析。“微博辟谣”是新浪微博虚假消息辟谣官方账号,通常转载其它认证账号发布的“辟谣信息”,每日汇总为合集置顶推送。

数据分析发现,“微博辟谣”账号转发的相关微博,其主题集中在“疫情传播情况”与“政府政策措施”上,呈现形式以文字为主,近7成被判定为谣言的信息中未交代信源

在近千条相关微博中,除“肺炎”“疫情”“武汉”“新型冠状病毒”等与事件直接相关的词汇外,“车辆”“口罩”“消毒”“人员”“指挥部”等是主要的高频词。与人们生活贴近的“小区”“门店”“超市”“外出”等也频频被提及。“转发”“转告”等高频词映射出相关内容的传播需求。

将“微博辟谣”平台试图撇清的谣言按内容分类绘制成折线图,每条折线代表不同内容类别的微博随时间变化的情况,有关“疫情传播情况”与“政府政策措施”的内容数量最多,比如“xx地又确诊了xx例病例”、“xx刚从武汉回来”等内容分别在1月28日和2月6日达到高峰。随着各地防控措施的加码,“我市今晚12点进行大规模消毒”、“我市即将封城、封路”等有关政策措施的内容也随之流传。

分析相关微博,我们发现被“微博辟谣”转载被判定为谣言的内容中,52%的内容以纯文字的形式呈现,单独以视频形式传播的内容占到了8%,图片配文字以及视频配文字的形式也较为多见。

力求真实与客观规范的新闻写作中强调交代信息来源,并且要交代信息来源的全称或全名,也就是具名。在我们分析的相关微博内容中,未交代信源的占69.8%,不足1.5%交代了信息来源的名称

被判定为谣言的内容中,有30.2%写明了信源,假借官方发布内容是最常见的方式,例如以“市政府办”、“公安局网络中心”等落款。其次则是假借其他“知情人”消息,例如有些内容来自内部工作人员透露。还有部分内容假借了媒体和专家的名义,如通过PS合成电视节目截图,或“钟南山院士称盐水漱口可防病毒”等。

新闻写作专业规范也要求提供时间和地点信息,这是新闻五要素(5W)的重要组成部分。被认定为谣言的内容中,包含时间和地点要素的内容占47.46%,另有36%的内容提供了地点信息,这些内容通常在特定地区传播,比如某地确定病例超过几千等。也有的内容在全国各地复现,例如“全城大消杀”、“某小区酒精消毒后开空调导致火灾”等,反映出较为普遍的社会心态。

复旦大学新闻学院周葆华教授认为,带有时间和地点的信息,使得内容看上去比较具体、准确,对传播有作用;诉诸权威信源的策略则反映了来自权威部门的信息容易获得信任和传播,这也提醒政府部门应当及时公开与疫情有关的重要公共信息。

那么是谁在发布被判定为谣言的内容,又是谁在发布辟谣信息呢?从获取的数据来看,除去未交代发布主体的微博,绝大部分被判定为谣言的内容都是由普通个人发布的,也有极少数出自媒体、政务机关、自媒体等。而发布辟谣信息的则多为政务机关,媒体也是较为重要的辟谣主体,此外,少数辟谣信息由专家、普通个人、自媒体等发布。

使用百度AI情感分析相关微博,结果显示,负面情感大于正面情感的内容占到六成以上,相关的内容涉及感染情况等。而正面情感大于负面情感的内容则多与新药研发、防治方法等相关。

疫情事件本身的重要性、高风险、高关注决定了相关信息的大量传播,周葆华认为,疫情事关每个人的生命健康与安全,充满风险与不确定性,公众对疫情信息的需求度很高。同时,我们身处信息高速流动的移动互联网时代,加速了信息的传播;与疫情有关重要信息的公开、透明不够及时、充分,也是影响部分传言或谣言产生的可能因素。

根据学者研究,谣言中的“谣”在古代汉语中指不用乐器伴奏的歌唱,这种随意性、摇摆性和不确定性为其向谣言、谣传等词汇的过渡埋下了伏笔。[i] 在不同社会情境中,对谣言的界定尚存争议。不过研究者大多认同:“谣言的产生首先与信息结构有关系。面对不确定的事件,如果权威的信息无法及时跟进或不足以消除大众疑虑,谣言就会填补这个空白,帮助人们建构事件的意义。在没有权威信息之前,传播谣言能帮助缓解焦虑。”[ii]

由于社会环境、社会心理等因素,谣言作为一种面对重要事件、存在模糊性情境下必然会产生的“即兴”信息,不可能完全消除,但可以减少其规模与负面影响。周葆华教授认为,首先,在信息的供给方面,政府等掌握公共信息的部门应当坚持公开透明,及时发布信息、回应公众关切,减少公众疑虑;在公众对信息的接受方面,则需要增强对纷繁复杂信息的鉴别力,例如对信息、信源的核实查证能力,通过多个渠道来校验与核实信息,提高自己的信息素养。

彩蛋:

识别照片真伪小工具TinEye

信息海洋时而可见移花接木的信息,比如三年前拍摄的图片,重新成为热点,使用TinEye等图像反向搜索引擎即可帮助公众鉴别图片真伪。

用户可以在TinEye主页面中上传提交图像文件或输入图像地址,随后TinEye会匹配寻找该图像的大量编辑版本,在搜索结果中提供各编辑版本的图像网址和发布时间,将搜索结果“按最旧排序”则可寻找到最接近源图像的编辑版本,根据其网页内容辨别图片真伪。

附录:研究方法

本研究自“微博辟谣”账号平台爬取了2020年1月20日至2月11日间与新型冠状病毒肺炎(NCP)相关的辟谣微博共804条,其内容涉及被认定为谣言的信息以及辟谣信息。随后我们对疫情无关和重复谣言进行删除、对合集谣言进行拆分后共得谣言946条。

基于相关文献回溯,本研究从内容特征、呈现形式及发布主体等维度进行分析。其中,内容特征包括内容类别、信源交代方式、信源是否具名、是否含时间、是否含地点等维度。呈现形式包括纯文字、文图、文字加视频等。发布主体主要分为普通个人、媒体、政务机关等。

编码由四位经过系统编码培训的编码员共同完成。以下是编码规则。

在编码培训中,所有编码员两次对随机选取的数据进行预编码,并严格对比编码结果,集中讨论编码过程中遇到的问题,解决编码分歧,最终对编码标准进行了统一。正式编码中,依照评价一致度计算(Krippendorff’s alpha coefficient),编码员互相信度平均值为0.728。

此外,编码员在编码过程中还对被认定为谣言的原微博进行了采集,由于原始内容或被删除,采集的原始内容多来自辟谣微博描述或截图。通过对整体文本的内容分析,研究增加了词频分析和情感分析维度,情感分析工具为百度AI情感倾向分析平台。

参考资料:

[i] 张志平,“‘谣言’的词源学和现象学释义”,《社会学家茶座》,2009年第3期,102-103页。

[ii] 刘海龙,“技术已经这么发达,谣言为什么还灭不完?这不奇怪”,2019年,https://new.qq.com/rain/a/20190409A0O9EE00。

作者:何诒雯、李泓、麻慧琳、陶晨、温瑞琪、张淑凡、朱月萌、王晶晶(华东师范大学通信与电子工程学院)、徐奕湛(华东师范大学通信与电子工程学院)

复旦大学新闻学院《数据分析与信息可视化》(本科生)、《数据新闻与可视化》(硕士生)课程专栏

指导老师:周葆华、徐笛、崔迪

本文为湃客·有数栏目首发稿件,未经授权,禁止转载。

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈