澎湃Logo
下载客户端

登录

  • +1

圆桌:跨界、破圈的数据报道|2020数据创作者大会实录③

2020-09-23 11:31
来源:澎湃新闻·澎湃号·湃客
字号

9月17日下午,由澎湃新闻主办的“2020数据创作者大会”在上海成功召开,百余位数据领域实践者齐聚一堂,共同探讨“疫情下的数据表达”这一话题,继2019年首届数据创作者大会后,再次挖掘数据背后的无限可能。

大会首次发布《2020疫情数据报道分析报告》,并围绕“疫情数据的传播与叙事”和“疫情之后,数据叙事如何持续发挥影响力”两大话题展开讨论。本文为大会干货的第三篇——数据报道如何挖掘专业价值。

01

疫情期间,我们都在做什么?

许小可:我是大连民族大学信息与通信工程学院的一名老师,学术背景主要是社交网络分析和计算传播学。

新冠疫情期间,我们收集了全国除了湖北省以外,几乎所有个体病例的公开数据,花了大概一个月时间,对数据进行结构化整理,然后做了一些分析,在学术期刊上发表了几篇高质量的文章。结构化数据是一件很不容易的事情,我们也想把这个数据公开出来,但科学研究公开与新闻媒体的公开角度是不一样的,它需要通过评议才能公开。

说回研究,赵鹿鸣之前说到,我们最害怕的是亲人受到新冠肺炎的感染,事实是很多新冠患者都是被亲人传染的。绝大多数情况下,0到17岁的未成年人或者60岁以上的老人,大多都是被我们这种年轻力壮的18到49岁的成年人传染的。这里也呼吁大家多关注自己的健康,因为你感染以后可能很快就恢复了,但身体素质稍弱的儿童和老人就不一定了。

李婷:大家好,很荣幸能参加这个活动,来到这个会场对我来说就是很大的破圈。我的专业是社会人口学,我努力在找我和数据新闻有什么共同点,大概就是我们都是数据驱动的。

为什么今天我能来到这里?因为除了老师的身份,我们还有一个公众号叫“严肃的人口学八卦”,最开始是玩票性质的,团队二十来人,主要就是学院的老师和师生,基本上没有一个人受过正统的新闻传播学训练,相当于一个野生的自媒体。当然,我们也不能称为自媒体,因为做这个公众号目的是为了锻炼学生,顺便完成了知识传播。

疫情期间,我们在澎湃新闻湃客·有数栏目上发表了十来篇文章。很多媒体生产的的数据新闻大都是描述型的,而我们着重关注数据背后可以解释的东西。总结来说有三类,首先是在疫情暴发阶段,我们比较早就在做一些科普性文章,像病死率和死亡率有什么区别,病死率的变化规律是什么等等。随着疫情发展,也开始做一些解读,像大家都在关注人口迁移流动时,很多媒体当时产出了很好的可视化,而我们主要关注流动的结果是否影响疾病的传播

到后期国际疫情蔓延,我们也有解读国外的数据,包括从人口老龄化和家庭居住方式来解释意大利开始时的病死率为什么那么高,因为意大利的年轻人比起西欧的其他国家,更喜欢三代、四代同住,所以老人感染新冠的风险更大。同时借助美国公开的调查数据,看到很多有钱人其实都离开了疫情最严重的纽约,真正留在纽约的可能是一些社会地位比较低下的人,背后隐含着社会分层

总结来看,我们在数据生产方面做的相对少些,重在数据解读,这与我们自身学科背景密切相关。

沈从乐:我来自第一财经·新一线城市研究所,这两年是以一个有数据新闻基因的城市数据研究机构这样的身份,来定义自己。

疫情期间,我们做的事情主要来自媒体人的原始冲动,今年1月22号,我们发布了第一篇和疫情相关的数据《武汉肺炎疫情传播增长图丨内附共享数据文档》,当时地图查询的平台还没有出来,我们想做一些数据分享给大家。第二天又发布了《500多万人离开了武汉!他们都去了哪里?大数据告诉你》。春节期间我们总共做了三篇疫情报道。

我们每年上半年的任务很重,要发布新一线城市的排行榜。今年的疫情给城市带来非常大的变化,所以在利用大数据评比城市商业魅力的过程中,我们在疫情数据基础上,做了一份《哪些城市更能提供安全感?| 2020城市应急能力报告》,由于生产周期比较长,这份报告在五月发布,三月底数据就截止统计了。因此四五月份城市复苏之后,我们做了一个城市复苏相关的数据研究,根据商圈里面人口监测的数据,看到城市恢复的变化。

总的来说,我们有来自媒体人的原始冲动,同时又从自身城市数据研究领域出发,分成三个阶段开展疫情下的数据报道工作。

冯里婧:我毕业于复旦大学经济学,做了两年数据分析师,现在身份是一个纯数据爱好者。疫情期间我参加了两个项目。

二月份的时候,有一个志愿者项目Wuhan2020,帮助解决政府或者是企业没有来得及解决的问题,比方说物资运送。加入进来的学数据科学或量化的研究者们组成了一个小组,用技术手段获取市一级患者的数据,并召集志愿者人工获取部分数据,提取相关信息进行疫情研究。第二个项目是MIT,类似于“黑客马拉松”的活动,全世界几百人参加,做相关的城市、疫情人口学的研究。

02

我们为什么会和数据新闻联系在一起?

许小可:每个人都有每个人的特长,我觉得数据新闻创作者身上有很多可以学习的地方。有时候,数据新闻和我做的研究,使用的数据是一样的,两者如果进行融合,对我做研究也是有益的。

大家生产新闻需要数据,对于我们这些研究者也是一样。可能大家和我感受一样,这次新冠肺炎公开了很多数据,我相信以后会公开得更多。以后会有更多其他专业的人加入到数据内容生产,这个领域会越来越庞大。

李婷:参与到疫情是我们的一种本能。人口学,从狭义的角度来说它就是数人,也就是要看人口变动的情况,还有一个是看人口的迁移流动。疫情看上去是公共卫生领域的一个疾病问题,但实际上它有非常大的社会外部性,正因有这种社会外部性,它才受到这么大的关注,对这个社会产生如此大冲击。

恰恰人口学研究就关注某一个现象社会的外部性,所以我们的关注出于本能。在关注疫情的过程中,我们一直想应该怎么去解释它,研究到底会产生怎样的社会外部性,这也是我们专业的一种优势。比如说我们会做一些疫情过后离婚率会不会上升的想法分析,也会看到这些人口结构,各方面的家庭模式,人的交往是否会影响疾病的传播等等,所以这个是我们的专业优势,也是我们讨论疫情的一个切入点。

沈从乐:如之前所说,参与到疫情来自于作为媒体人的原始冲动。在这个特殊时期里,我们发挥过去积累的经验,一个是对于政府公开数据的收集和整合能力,我们知道在哪里找数据以及迅速找到准确的数据,这对我们后面建立对整个城市的应急体系的评估有很大帮助。另外是我们对城市综合评定的能力,我们知道如何系统性的建构指标,知道如何去传播。

冯里婧:在做志愿者时,我们组里有很多数据科学或者说量化研究学者。很多来自城市研究学、经济学,统计学的同学一起发现问题,研究问题,解决问题。这些人加入进来有一个自发的热情,大家有着不同的学术背景,感兴趣的方向都不一样。能找到一个合作者是非常走运的事情,写一篇文章也是如此。

我后来慢慢退到一个支持者的角色,想做一些开放数据,但这只是一个意图,因为我没有这方面的经验和团队。另外一方面,我们组其他同学也有各自的个人成果,比如说东大的学生跟南科大合作了一个轨迹模拟的项目,轨迹数据很难获取,可能内部有一些数据,但用新闻公开的数据是很难做的,工作量非常大。后来还有人做欧洲疫情数据,政府数据的问题不仅仅我国也有,其他国家也有,欧洲国家有的时候一天发两次数据,周末就不更新了,比较随便,他们就用方法把数据收集起来。这都是他们个人兴趣的沉淀,不能代表我个人,但都表明了他们为什么来做这些。

刘畅:冯里婧让我印象很深刻,你参与了一个众包的项目,对于数据记者来讲,我们缺乏专业的知识或者背景,所以在应对一个突发事件的时候,用合作的方式产生新闻也许是未来会出现的一个场景。能不能请你分享一些与不同背景的人进行合作时的经验与教训?

Wuhan2020 Github页面

冯里婧:主要有两个方面。一是如果这个人愿意跟你合作,本身就代表了他的开放态度,他肯定是有动力去做这件事情的,所以沟通起来会比较顺畅。

第二,社会认知和学术认知是两个不同的领域,如果你真的要做一个学术研究,那是一个很长时间的事,如果只是自己做一个分析,最后可能没办法形成学术成果,这个时候就需要一点动力。这是很关键的,类似人要有一点东西去激励他前进。如果你(作为媒体)去寻找合作者,这件事情本身就可以激励他做得更好。我的观点可能不全面,谢谢。

03

数据报道的传播,如何让普通读者看懂?

刘畅:下面再聊聊数据报道传播的问题,数据新闻现在还是一个比较有门槛的领域,所以有时候要简化,或者针对某些爱好者做定制。各位觉得写给普通读者的数据内容应该怎么做?

许小可:很多打动我的新闻,技术上不一定多么牛,但它肯定有很好的人性方面的内核。

大家前面也说到在数据获取、处理以及可视化上的一些困难,不是每一个数据创作者都可以一个人完成所有事,可以交给其他更专业对口的人去解决。

从数据获取和整理的角度来讲,学界和新闻业界打通的还不够。在做数据新闻的时候,更多的利用外界的一些力量,把各自的优势发挥出来,我觉得可能会做得很好,这是未来可以尝试的发展方向。

李婷:传播数据新闻,找准定位很重要。和年轻人对话,话题尽量轻松,当然要有社会意义,这很重要。另外,语言表达也要活泼一些,不要那么严肃,配图可以多一些。

作为读者去看可视化新闻,特别能打动我的是那些有很强人文关怀的报道。一些专业性的知识可能会提高数据新闻的读者门槛,但能产生情感上共鸣的报道大家是很愿意阅读和传播的。好的传播和形式相关,跟题材和所传递的价值更是相关的,因而我们要看到数据背后真实的故事和它所传递的情感。

沈从乐:传播的最终要解决受众和传者之间的信息差问题。从传播者的思路来讲,尤其是研究型的传播者,他们希望将自己的研究框架告知观众,但是信息接收者更想不费力气就能知道你在表达什么,所以如果存在这种不对等,就会出现传播的无效抵达和信息消耗。要达到更好的传播效果,就需要知道你的受众是怎样的。所谓网红的爆款很多都是这么来的,它的研究或者最终传播出的点其实非常简单,越容易被大家吸收就会达到越好的效果,这是我从老本行出发的浅见。

冯里婧:我对于写高质量爆款文的经验非常少。作为一个读者来讲,我个人的习惯是,有一些偏人文关怀,比如卡车司机困在高速上,我会转发分享出来;而一些有深度的文章我会收藏,会留着慢慢品味。我回忆这段时间看到的印象比较深刻的数据新闻,比如今天主办方澎湃有两个作品我印象很深,一个有很多横轴的波浪图(图1),一个环形扩散的图(图2)。因为我在一月底的时候就尝试着去呈现这个数据,也用卫健委的数据做了两个条形图。这个东西后来我做出来以后发在朋友圈,大家反馈看不懂。但是,有研究界的朋友跟我说,你这个数据我们可以延展下,用在写给相关政府部门的报告里,算是弥补了这一块。

图1

图2

04

未来,数据报道如何挖掘专业价值?

刘畅:在大的框架下,数据报道如何挖掘专业价值?在未来您觉得还有什么计划,或者是想要尝试的事情?

许小可:我觉得有责任感很重要。中国人的责任感是非常强的,我老师原来做SARS的,当时病例每天涨,很多人都处于崩溃的状态,这种责任感驱动着我们走到今天,我相信好多学数据新闻的人也是有这份责任感。数据是对我们时代的记录,未来希望数据能发挥更大的作用。

李婷:不管是学者还是媒体人,常常陷入两端的困惑,一方面是数据很多,好像到处都有各种各样的涌来的数据。另一方面,又觉得数据很少,很多时候这个数据不知道该怎么用,不知道什么是有价值的,什么是能够挖掘的。

就数据报道而言,需要“数据的想象力”。就是决定我们做数据新闻的,不是说你数据的技术如何,这个技术我想对所有的人来说,它最后会变化一种标准化的东西。但是差别在哪儿?就在于你的想象力,想象力就是怎么用数据,怎么去发现问题,怎么去找到一个好的问题,这个不管是做学术还是做新闻传播,是决定高下的地方。

沈从乐:我觉得接下去要做的事情很简单,就是数据报道如何挖掘专业价值,希望能够让更多专业的人加入到城市数据研究这个领域里面来,用更多专业的视角,将数据内容通过各种渠道传播出去。

冯里婧:我们在做数据报道的时候,可能都会有一定的局限性,我相信很多做数据的人多少都有点体会。找到好的报道角度很关键,要围绕关键的问题展开。

*注:演讲内容有所删减。 

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈