澎湃Logo
下载客户端

登录

  • +1

计算社会科学中的政治传播都做些什么?

2023-04-28 11:23
来源:澎湃新闻·澎湃号·湃客
字号

计算社会科学与政治传播

摘要:

政治传播的环境随着技术变革变得愈发复杂,解构政治传播的难度也随之提升。本文描绘了政治传播领域中开发、整合以及应用数据收集和分析技术的机遇和挑战。这些技术主要依靠计算方法和工具来回应政治传播领域中理论驱动的实质问题。本文专注于政治传播学术圈相关的计算传播科学理论、实证和制度。同时也评估了学术界对计算科学传播的理解,并强调其与数据资源需求相关的挑战,以及与数字信号的理论和语义相关的的问题。

作者简介:

Yannis Theocharis,慕尼黑工业大学

Andreas Jungherr,班贝格大学

文献来源:

Theocharis, Y., & Jungherr, A. (2021). Computational social science and the study of political communication. Political Communication, 38(1-2), 1-22.

本文作者Yannis Theocharis (左),Andreas Jungherr (右)

一、导言

数字通信为社会和政治互动开辟了许多新途径。这些对政治信息环境及其塑造的民主态度和行为产生了根本影响。公民不仅能够以 20 年前难以想象的方式表达自己的立场,而且更广泛的媒体生态系统也使得政治传播发生了系统性变化,例如媒体平台的扩大以及社交媒体作业政治信息的来源变得愈发重要。这些趋势正在改变传统的政治信息生产、流传和消费动态。大量的政治信息大量被娱乐化、碎片化,同时假新闻和错误信息也日益泛滥。这不仅影响了政治传播过程,也给相关研究增加了新的挑战。这然而,这些问题的核心仍然是政治传播学者一直在问的问题:我们应该如何可靠地衡量特定媒体渠道或政治行为者的影响力,并评估信息所带来的影响——尤其是在这个全新的、嘈杂的和极度混乱的信息环境中?

尽管随着政治信息环境复杂性的增加,解读政治传播过程及其影响的挑战越来越大,但是同时社会科学家们的工具集和能力也随之变强,这让学者们可以更好地研究和理解政治传播。计算能力的沉没成本和数据科学工具包的广泛访问使得以前仅限于高度专业化的技术社区已经提供了对包含政治信息、新颖数据收集实践和一系列新方法的各种数据的访问。这些发展通常在计算通信科学这一术语下进行讨论。本文将主要依靠计算方法和工具开发、综合和应用数据收集和分析技术的研究视为计算政治传播,目的是解答政治传播领域中实质性的理论驱动问题。

二、定义计算传播科学

本文将计算政治传播(Computational Political Communication)置于计算传播科学(Computational Ccommunication Science)的子领域内。而计算传播科学又是计算社会科学(Computational Social Science)在传播领域的一个变体 。计算社会科学是一个正处于发展阶段的跨学科科学子领域,但其目前仍缺乏明确的界限。

本文将计算社会科学定义为一个跨学科的科学领域,在该领域中,贡献者通过使用计算方法和实践来发展和检验理论,或提供对人类、组织和机构行为的系统描述。在最基本的层面上,这可能意味着在结构良好的数据集上使用标准化的计算方法,或者在更高级的层面上对专门用于解决分析密集型问题的特定软件解决方案的开发或广泛修改进行分级。因此,计算传播科学是位于计算社会科学和传播学的交叉点。其主题关注与传播渠道、对象、行为和效果相关的理论和现象。

三、对计算社会科学的两个期望

学者们对计算社会科学的描述通常伴随着对他们对社会和人类行为研究的强烈期望。这两个期望也适用于政治传播的研究。其一是期望通过数字跟踪数据和数字传感器增加对社会现象和人类行为的覆盖;其二则更进一步,期望社会科学的本质发生转变。

在最基本的层面上,支持计算社会科学的学者认为数字化转型导致社会科学家可用数据源和类型的大量增加。对于原则上以前可用但现在可在更大范围内使用的数据(例如报纸语料库)。除此之外,我们还有新的数据源。一方面,用户与在线服务的交互会产生数据痕迹。原则上,这些数字跟踪数据全面描述了用户使用数字服务并通过数字服务进行调解的行为,并且还可以提供以前无法获取的环境详细信息。出于这个原因,它们对政治传播研究人员来说非常有前途,因为它们允许在我们这个时代可能是最活跃的政治信息环境中调查过程和行为的切入点。

然而,在实践中,大多数政治传播研究人员只能访问非常有限的数字跟踪快照,并且在数据访问方面仍受数字平台的支配。这样做的好处是,这种类型的访问仍然比没有进入平台数据流的狭窄通道要好,而今天许多令人兴奋的交流和政治发生在这些平台上。虽然数字跟踪数据看起是一场学术革命,然而,其本身可能带来的数据意义问题和方法论问题,也增加了进行计算社科研究的困难,它使得数字跟踪数据的全部承诺比最初希望的更难以实现 ,我们可以从海量数据语料库中提取一些实际有用的东西。除此之外,我们还会遇到由数字传感器提供的新数据源。这可能是作为其他服务的副产品出现的数据,例如卫星图像,或者是研究人员专门设计的传感器的输出。原则上,这种数据类型必然会随着物联网设备的可用性和广泛分布而增加。

结合起来,可用数据源的增加可以增加对社会现象和人类行为的覆盖面。它还能够以更高的时间、行为和程序分辨率对众所周知的现象进行检查,尤其是与其他社会科学探究方法相结合时。这也可能允许从更系统的角度看待社会和人类行为。例如,虽然过去使用调查和调查实验研究了错误信息现象,但组织数字痕迹与个人层面的数据现在可以提供更大的影响。深入了解接触虚假信息或错误信息的机制,提供单独使用调查数据无法获得的见解。在这里,研究人员不仅使用比以前更多和不同的数据,而且为了实现他们的目标,他们在数据生成和分析过程中都进行了高度定制。

更雄心勃勃的是,大量数据集的可用性记录了人类与数字服务交互的行为——或被数字传感器覆盖——这也导致人们期望社会科学可能超越其软科学的地位,成为一门实际的科学学科,其模型允许对未来充满信心的预测。在这种观点下,更多的数据不仅意味着社会过程或人类行为的覆盖范围增加,而且实际上将允许社会科学中的“测量革命”(measurement revolution),使他们能够克服目前的状态 -事实解释模式并发展成为具有真正预测能力的科学。这种期待基于一种观念:社会是由一种与情景相独立的因素所塑造的,由于缺乏可以有效观测的手段,这些因素往往显得十分抽象。

总的来说,虽然这些期望得到了很好的阐述和突出的推进,但实现它们的挑战仍然存在。回顾近十多年的研究,我们至少可以确定三个问题领域:

1.计算社会科学研究在将其研究设计和发现与社会科学中既定的理论、概念、机制和讨论联系起来方面仍然薄弱;

2.计算社会科学中数据生成过程以及它们对可用数据集中信号的组成、覆盖范围和解释意义的影响;

3.计算社会科学作为一个跨学科的研究领域,努力建立实践,使其在既定的社会科学中更牢固地联系起来,制定数据收集、准备、协调和分析方面的透明度标准,并使研究人员、行业和研究人员之间的利益冲突浮出水面并问题化。

四、计算传播科学所面对的挑战

数据和资源需求

计算传播科学中的挑战与其他计算社会科学中的挑战并无二致。 其最相关的特性是超大尺寸的数据集。这一发展催生了“大数据”(big data)这一概念,以讨论相关的研究潜力。

从根本上讲,数据集规模的增加会带来存储和处理方面的实际问题。虽然计算机的算力确实在增强,但这并不能弥补新型数据集对它们提出的日益增长的需求。文本数据已经如此,对于具有高分辨率图像或视频的数据集来说更是如此,这些数据集对政治传播学者的实用性越来越大,尤其是当研究兴趣转向 Instagram、YouTube 和抖音等平台时。收集和使用各自数据集的项目越来越多地面临重要的数据准备和处理任务,这些任务远远超出了社会科学中典型项目的范围。

大型数据集还带来了相当大的隐私问题、数据所有权以及随后未解决的研究透明度和可复制性问题。此外,在实践中,大多数在线服务的用户很可能仍然没有意识到他们的公共贡献和互动(以及相关的元数据)可能对其他人可见并且受制于经常使用这些数据推断他们的偏好的研究项目 、特征或行为偏好。

尽管科学界对透明研究实践和研究项目基础数据访问权限的认识在不断提高,但隐私问题和基础数据的专有性质使得建立类似标准变得更加困难。与在社会科学中制定透明度标准相比,这通常会导致学术论文仍然不透明。

链接:数字信号的理论和语义

链接(Links)是计算社会科学中一个更隐蔽的挑战,具体到到计算传播领域,链接是在于将数据和结果与感兴趣的现象和相关理论联系起来。社会科学是一个高度依赖语境的发现领域,使得宏大理论变得站不住脚。尽管如此,将研究与已被证明在涉及某些过程、现象或行为时起作用的现有理论机制联系起来,可以让研究人员构建似是而非的研究难题,并建立与先前知识的联系。这使得我们能够评估我们之前对现实的理解的哪些部分得到新发现的支持或反驳。只有既定的理论思想与新颖的研究环境、现象和方法之间的这种积极联系,才能出现累积的证据体,而不是重写不相关和孤立的发现。

除了理论的链接之外,数字信号的语义,即数据中发现的信号与研究感兴趣的现象之间的联系,是另一个目前在计算社会科学中被主要忽视的链接。任何在社交媒体上进行研究的人都知道,任何给定的数据点都是一种符号表示。它可以代表一些直接和明确的东西,例如,在朋友圈点赞可能是对另一位用户发表的帖子的支持表达,它可能代表对事实或解释性陈述的同意,可能是对另一位用户的同情表达,或者是一种行为社会资本维护完全与喜欢的帖子的内容没有任何直接联系。虽然有人可能会争辩说,调查研究人员经常面临类似的问题,但将信号与社交媒体环境中的行为联系起来是一项风险更大的尝试。这不仅是因为平台的不同架构以及每个平台的嵌入式功能所提供的特定活动所提供的多种社交线索。这也是因为与分配给特定行为的含义相关的难以衡量的错误。信号和表示对象的语义可能不仅随时间变化,而且在内容类型(例如,文本、图像或视频)和服务之间变化,尤其是考虑到我们对平台可供性变化的了解。这使得研究人员明确说明他们对信号和表示对象之间关系的解释以突出他们的基本假设至关重要。目前,数字轨迹直接表示的现象常常被忽略。相反,学者们倾向于将他们的兴趣投射到数字跟踪数据中发现的信号上,而不太担心在他们选择的信号和感兴趣的现象之间建立联系。

标签:可以根据数字痕迹推断人的特征吗?

计算社会科学中的标签实践与在数据中的信号和它们应该表示的现象之间建立语义链接所产生的问题紧密相关。计算社会科学中的一个显着特征是根据个人或数字化身在数字痕迹中表现出的行为将标签归因于个人或数字化身。标签(Labels)是计算社会科学的强大工具,因为它们允许根据用户的感知特征或偏好大规模自动分配干预措施。在这方面,它们类似于其他领域的评分程序。不出所料,这对提供标签命题和解决方案的研究人员提出了一系列担忧和要求。

对于学术研究者来说,确定数字痕迹中的信号与其他记录个人特征、偏好或预期行为的指标之间的相关性是完全合法的。如果这些标签解决方案成为商业模式或政策干预的基础,那就完全是另一回事了。为此,数据标签工作需要更严格的审查和公众监督。

标签无疑很重要,自动将社交媒体用户标记为机器人或者政客的支持者尤其会带来风险。虽然当标签工作停留在学术论文的范围内时,这些风险仍然是可控的,但一旦未经审查和无人监督的标签解决方案广泛部署在在线平台上并成为推出自动化干预的基础,它们就会呈指数级增长。在当前加剧的政治气候和不透明的平台治理实践中,学术界应该对标签的分配方式、审核方式以及它们作为干预措施的基础加倍谨慎。

就目前而言,计算社会科学尚未在其实践中充分体现这种道德责任。总的来说,计算社会科学需要对拟议的标签程序进行更加警惕的可靠性、有效性和稳健性检查,因为过度热情的原型可能会难以控制社会影响,一旦集体想象力变得难以抑制占有他们。

原有理论与新事物的碰撞

数字技术扩大了每个人的影响范围,改变了社会系统的构成和流程。虽然一些政治传播过程和现象可以用现有的理论令人惊讶地很好地解析。因此,在一个流动性高、选择多且复杂的政治信息环境中,政治传播研究人员特别适合采用理论驱动的设计,如上所述,将研究结果与既定话语联系起来,同时也推动理论化,从而让这个领域能够解释我们正在经历的人类行为、制度和社会结构的变化。

在撰写本文时,学者们正在积极研究 COVID-19 大流行的影响。 但是,尽管 COVID-19 大流行固然很重要,但我们对重大事件期间政治沟通过程的现有理解并没有给我们带来新的重大理论问题。例如,我们已经对 Twitter 上的对话动态和信息传播有了期望和扎实的知识。我们也很清楚为什么社交媒体可以证明对于使团体和个人能够在他们的社区组织团结和集体行动至关重要,为什么某些类型的错误信息可能会导致某些年龄组而不是其他年龄组两极分化,以及为什么社交媒体功能可能有助于 某些人使用谎言获得支持,而不是在民意调查中面临彻底的破坏。我们在这里的目的不是预先判断,或者甚至给出什么是好的和坏的研究的指示。也不是说做这个研究而不做另一个,或者使用这套理论和工具而不是其他的。相反,我们的目标是指出某些变得越来越普遍的方法中可能存在的缺陷,并解释我们认为到目前为止可以更好地体现的研究特征,这些特征可以帮助该领域以更有趣的方式解决重要问题。

理论化的另一面,尤其是在新的和不熟悉的环境或背景下,是需要广泛而勤奋的描述性工作,以便广泛和系统地映射新现象。在过去的几十年里,社会科学固有的受欢迎的成熟过程在某些领域引起了对描述性工作的忽视和积极劝阻。虽然这对于其他人(比如记者、律师或历史学家)正在做描述性繁重工作的领域来说可能是合理的。但在 计算社会科学中采取这种态度是错误的。绘制数字化转型在各个领域以及跨文化、时间或国家背景下的影响的任务绝非微不足道,而且对于公众理解和该领域的进一步发展至关重要。

实践:基础设施、学术机构、伦理和计算方法培训的关键作用

计算社会科学是一个跨学科领域,处于各种社会科学、计算机科学甚至一些自然科学的边界之上,对社会科学尤其是政治传播的研究实践产生着重大影响。虽然来自这些领域的研究人员之间的边界正在发生一些交流,但实际上每个人都将他们原来领域的实践和标准带到计算社会科学的新尝实践中。因此,计算社会科学不受连贯的理论传统、特定方法或数据集支配也就不足为奇了。相反,我们发现有无数的方法和标准在起作用。这使得很难找到一种连贯的语言并开发一个框架,在该框架下,来自不同传统的实证研究结果遵循不同的标准,以促进对研究的累积说明。

计算社会科学中最公开可见的工作始终基于研究人员通过与数字平台的特权合作伙伴关系获得的专有数据。由于各种原因,这对该领域的未来令人不安。一方面,对专有数据进行研究的需求加剧了现有的权力失衡。虽然伯克利、斯坦福或麻省理工学院的研究人员可以依靠强大的校友网络在提供数字平台的公司中获得访问权限和信任,但来自欧洲和其他地方的研究人员不能依赖这种访问权限,因此始终 比他们资源丰富的同事更糟糕。这与绝大多数国际平台用户的文化背景和身份形成鲜明对比。研究人员的代表性不足,例如 亚洲和印度不可避免地导致研究关注西方民主国家尤其是美国平台使用的偏差。随着美国继续制定非常具体和连续的路线,这一点变得越来越重要,因此计算社会科学有可能主要针对这个特定国家非常具体的暂时问题发表意见。

更令人担忧的是,基于专有数据的研究无法在外部复制。这是很成问题的。首先,计算社会科学是一个新兴领域,标准可能会随着时间的推移而发生变化。因此,即使是最善意和最精心设计的研究也可能需要在标准发生变化或对数据收集和分析中潜在偏差的敏感性增加后几年后重新审视。如果没有透明的复制机制,这是不可行的。对专有数据的依赖实际上可能会危及该领域的方法学进步,并且应大力鼓励在这方面正在进行的解决方案对话。与此同时,基础数据及其选择过程的不透明性使得它本质上是一个基于信仰的决定,是否相信这些发现。由于提供上述数据访问权限的公司是自利实体,因此人们可能会认为这是一个薄弱的标准。更一般地说,计算社会科学依赖于公司提供的访问权限,而这些公司本身、治理流程和商业模式都受制于研究人员的发现,计算社会科学是一个深陷研究人员、公司和政府之间利益冲突的领域。截至目前,该领域忽略了对这些冲突的解释,也忽略了相关标准的指定——从而让问题被公众所知、继而让人们有能力克服这些冲突。

该领域的跨学科性质也给审查过程带来了挑战。来自通信科学背景的研究人员将根据她所在领域的标准和实践来审阅计算机科学家撰写的论文。因此,他可能会发现该论文不符合这些标准,而来自计算机科学领域的审稿人可能会发现它已准备好发表。本文作者在本期特刊的审查过程中的经验,其中审查者不是来自计算机科学,而是几乎完全来自政治科学和传播领域,已经表明计算社会科学不太可能发展出连贯一致的理论核心。编辑和审稿人有必要反思这些挑战,并相应地以更广阔的视野审阅论文,而不是审阅自己领域核心的文章。

最后,这一挑战也出现在计算社会科学的教育上。如何避免将社会科学家重新训练成平庸的编码员和平庸的社会科学家中的计算机科学家?在提供计算社会科学的共同核心以允许从业者使用共同语言并对潜在挑战有共同理解的同时,又允许他们发散以便在理论、研究设计和方法方面发展必要的专业化方面的正确平衡是什么?这些是该领域尚无一致答案的问题,但在其成熟过程中具有根本重要性。

五、计算社会科学在政治传播中的前景

新型数据的可用性以及理解它们的计算工具和方法的开发允许从以前不可能的角度研究大量的政治传播过程。通过将个人层面的数据与通过网络浏览器或社交媒体跟踪器收集的数据进行匹配,可以获得有关人们的新闻消费和媒体饮食的更详细、更准确的信息。这引发了关于接触不同类型的内容如何影响不同类型的行为(例如政治参与和媒体信任等态度)的新见解,并且可以帮助检验许多经典的媒体效应理论,例如框架、铺垫效应或议程设置。这可以让学者们更好地理解传统媒体和专业记者在日益丰富和竞争日益激烈的媒体生态中传统守门人角色的变化。

结合不同类型的数据还可以更准确地了解政治信息和内容如何对个人产生不同影响,这可能会加剧政治领域中已经存在的信息。质量参差不齐的问题。同样,采用数字跟踪和个人水平数据的设计能够回答许多与选举活动期间的政治交流相关的新问题。这些问题的范围很广,从人们如何战略性地部署沟通策略和语言来动员他人,到人们在观看政治辩论和集会时如何受到影响。

计算方法可以解决这个时代所特有的大量现有问题和研究难题,这个时代从不同角度和不同方式受到数字媒体的影响如此之大。正如本文所展示的,计算政治传播、计算传播科学和计算社会科学可能会根据所讨论主题的广度而有所不同,但它们不会根据在社会科学、计算机科学和计算机科学的边界上创建跨学科领域的潜在挑战而有所不同。目前在这个十字路口工作的人仍然太少。将这几个进一步拆分成孤岛可能会减缓跨学科标准的发展,从而有利于在计算方法的使用中出现各种特定于子领域的实践。虽然这种发展可能会加快计算方法在特定社会科学子领域被接受的速度,但它的副作用可能是在社会、计算机和自然科学家之间的跨学科实践上建立壁垒。 我们怀疑这可能会对解决问题的新方法和方法的发展产生影响,并可能加强对社会科学问题的现成计算解决方案。

编译 | 汪浩东

审核 | 何升宇

终审 | 李井仁

©Political理论志

前沿追踪/理论方法/专家评论

ID: ThePoliticalReview

原标题:《计算社会科学中的政治传播都做些什么?|Political Communication》

阅读原文

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈