澎湃Logo
下载客户端

登录

  • +1

编译 | ARS新文:计算社会科学和社会学

2021-02-24 18:23
来源:澎湃新闻·澎湃号·湃客
字号

原创 Lance Political理论志

计算社会科学和社会学

摘要:

社会科学与计算机科学以及工程领域的结合产生了一个新的研究领域:计算社会科学。该领域将计算方法应用于新的媒介数据源,如社交媒体、行政记录和历史档案,以此发展人类行为理论。作者通过文献计量分析和对以下子领域的深入分析来回顾该领域在社会学中的演变:1. 社会网络分析和群体形成;2. 集体行为和政治社会学;3. 知识社会学;4. 文化社会学、社会心理学、情感研究;5. 文化生产;6. 经济社会学和组织;7. 人口学。研究表明,社会学家不仅是解决人类行为长存问题的前沿研究中心,而且也在发展关于数字空间的新的研究路线。最后,作者呼吁学者更多地关注社会学理论,并认为计算社会科学可能进一步融入主流社会学的新领域。

作者简介:

Achim Edelmann: University of Bern; London School of Economics and Political Science

Tom Wolff, Danielle Montagne, and Christopher A. Bail: Duke University

文献来源:

Edelmann, Achim, Tom Wolff, Danielle Montagne, and Christopher A. Bail. 2020. "Computational Social Science and Sociology." Annual Review of Sociology 46:61-81.

导言

近年来,互联网的兴起以及行政记录和历史档案的大规模数字化,释放了前所未有的媒介数据。与社会学家收集的传统数据库不同,这些新的数字资源往往提供了社会关系演变的丰富细节。与此同时,各种新技术现在可以用来分析这些大型复杂的数据库。其中包括各种形式的自动文本分析、在线实验、大规模协作、以及许多其他受机器学习启发的方法。随着媒介数据的快速增长以及分析这些数据的新方法,产生了一个新的跨学科领域,称为计算社会科学。由于其跨学科的不同起源,作者为本文提供了以下领域的定义:计算社会科学是一个跨学科的领域,通过将计算技术应用于社交媒体站点、互联网或其他数字化档案来进行社会科学的研究。该定义领先于社会学理论,因为作者认为社会学的未来不仅取决于新的数据来源和方法,而且取决于它产生人类行为新理论或阐述社会世界的能力。

作者的主要结论是,计算社会科学正在迅速扩展到社会学的不同的子领域。本文中的评论集中在七个领域。这些包括:1. 社会网络和群体形成;2. 集体行为和政治社会学;3. 知识社会学;4. 文化社会学、社会心理学和情感研究;5. 文化生产;6. 经济社会学和组织学;7. 人口学。这些领域的研究成果出现在旗舰期刊上,在大型会议上拥有众多讨论,并有助于激发社会学的公共价值。最后,作者指出未来研究的方向,希望能给更有效地将社会学理论纳入计算社会科学的研究,并呼吁加强与其他社会科学领域的合作,以确保计算社会科学继续向主流社会学发展。

数据与方法

近年来数据数字化迅速发展的众多领域之一是学术档案,再加上最近在自动文本分析方面的创新,启发作者使用计算社会科学的工具来绘制这个领域本身的发展。文章中的分析综合了来自大型文献计量数据库的数据、来自该领域会议的数据以及人为编码的多个阶段。图一呈现了2003-2016年计算社会科学在各个领域的发展。

研究发现

社会网络与族群形成

社会学中最早出现计算社会科学的领域之一是对社会网络和群体形成的研究。鉴于传统的研究技术难以捕捉社会关系的演变,许多早期的研究采用了来自互联网网站、社交媒体平台的数据进行了相关人口水平研究。例如,Watts利用电子邮件数据演示和阐述了数字空间中的核心社会科学理论,如网络动态和意见领袖。

最近的一些研究利用媒介数据来研究社交网络中复杂区域的扩散。例如,Centola创建了一个在线社区以此控制社交网络的拓扑结构。其他研究表明,网络拓扑结构也可以影响社会习俗的采纳(Centola and Baronchelli 2015)。社交媒体和媒介数据也使得对网络的分析具有前所未有的规模。如利用Facebook的数据,确定在讨论公共卫生问题的大型人际网络中,情感和理性沟通方式之间的协同作用。在另一项研究中,研究者使用谷歌搜索数据跟踪文化产品在全球网络中的传播。总之这些研究表明,个体之间的微观相互作用可以产生宏观层面的扩散模式。

集体行动与政治社会学

计算社会科学激发了大量关于集体行动和抗争政治的研究。来自社交媒体和其他在线平台的数据尤其推动了这一话题的研究。例如,对于埃及革命和占领华尔街运动的研究表明,数字工具在抗争活动中发挥着核心作用,这些工具生成的数据可以为集体政治的研究提供丰富的信息。另外,由于Twitter提供了大量的数据集以研究信息如何在网络中传播,Twitter已经成为这一领域的研究热点。更有研究通过分析Facebook的数据发现,网络支持者对运动的投入比地面上的积极分子要少。尽管如此,其他人发现社会运动中的线上和线下活动之间存在着强烈的对应关系 (Abul Fottouh and Fetner 2018; Hanna 2013)。即使在线数据不能捕捉所有的离线过程,它们通常也是对传统数据的有益补充。

计算社会科学研究也有助于发展社会运动中集体动员和行为改变相关的理论。Vasi等(2015) 利用社交媒体和谷歌的数据,展示了在纪录片放映的社区关于水力压裂的在线讨论和反对这种做法的集体动员是如何形成和增长的。此外,许多研究使用在线数据、自动文本分析、线上实验和建立仿真模型来检验政治两极化。这些研究调查了政治部落是如何形成的,并强调了“回音室”在其中的作用。计算社会学家也进行了实验,发现政治同质群体在在线博弈中能够做出更好的决定。

知识社会学

计算社会科学已经成为知识社会学的核心部分。其中一个方向便是利用引文数据来研究科学内部的共识的达成。由于引文数据已经变得更容易收集和分析,学者们可以绘制和模拟整个科学领域形成的过程。芝加哥大学社会学家James Evans的元知识计划 (Metaknowledge program) 就是这类研究的例证。他们追踪团队合作在科学领域日益占主导地位的研究表明,在社会科学领域团队合作的倾向在过去50年中增加了一倍多。其他研究表明,小型团队倾向于在科技领域引入新颖和颠覆性的想法,而大型团队则倾向于进一步发展现有想法。文本分析的进步也让学者们对学科之间的相似性和差异有了新的认识。如有研究利用文化洞 (cultural holes) 的概念,绘制领域内和领域间学科术语的差异。尽管这些基于语言的差异并不能精确地映射到引文网络中的结构漏洞上,但它们仍然抑制了科学家之间的有效交流。

除此之外,另外的文献探讨了学术工作是如何获得影响力和声望的。例如在社会学领域的研究表明,跨子领域的文章能获得更多引用,且更有可能出现在著名期刊上。计算方法也揭示了科学发现是如何由科学家个人的选择和他们的组织环境所驱动的。最后,计算社会科学揭示了科学界的性别不平等。例如,利用Jstor(最大的学术期刊数字资料库之一)的数据,West等人(2013) 追踪了1545年以来自然科学、社会科学和人文学科学术著作中的性别平等状况,结果表明即使女性和男性拥有相似的发表数量,男性仍然主导着单作者论文或享有声望的第一作者职位。

文化社会学、社会心理学和情感研究

计算社会科学也出现在文化社会学、社会心理学和情感研究中。在文化社会学中,一些研究考察了文化变迁的广泛过程,研究话语的承载能力和文化桥梁的作用。另外,文本数据的增长也为文化信息的表达开辟了新的研究领域,而此类研究大多涉及从Facebook或Twitter收集的大量数据。例如,有研究揭示了在Facebook上关于公共健康问题的公开讨论中情绪传染的可能性,或者说,接触情绪化语言使社交媒体用户更有可能自己变得情绪化,从而更有可能与情绪化内容互动。除了文本分析,学者们还开创性地使用虚拟现实、虚拟社区来进一步研究其他核心问题。

文化生产

计算社会学科经常被用来研究人们如何评价文化产品,如音乐、艺术或电影;该方法也测量了文化产品中主题的组合如何影响大众对产品的接受。另一类研究考察了个人之间的社交网络如何塑造文化物品的创造,此类研究通常侧重于新奇和创新的角度。最后,近年来的研究考察了性别、阶级和政治身份如何影响文化产品的生产。例如,Shor等人 (2015)发现,由于记者关注的是通常以男性为重点的话题,男性在媒体上的出现频率就会高于女性。

经济社会学和组织研究

计算方法和网络方法的交叉也在经济社会学中蓬勃发展。电子邮件和消息存档在组织中创建了大型的个人动态网络,这大大改进了通过自我报告生成的数据。信息传递数据还可以让研究人员衡量员工在经济决策过程中的协调程度。最后,网络数据改善了对社会资本和职业结果的研究。例如,研究表明,某些网络组成对女性的益处不同于男性 (Lutter 2015)。网络数据不仅有助于研究交流和职业结果,而且有助于研究组织文化。Goldberg等人 (2016) 分析了一家大型公司的电子邮件信息,以衡量员工的沟通是否符合现行规范和行为,发现融入组织文化的员工会获得各种奖励,被解雇的可能性较小。最后,Schnable (2016) 将定性方法与自动文本分析相结合,研究宗教如何为非政府组织提供文化框架,使他们能够赢得合法性、建立社会网络、获得资金和资源。

人口学

计算社会科学在人口学中出现的时间相对较晚,但正迅速普以用于产生高质量的人口估计。例如,移动电话数据被用来生产动态的人口估计,特别是在国家统计数据不可靠的地区。其他人使用谷歌街景和深度学习来估计社区的人口特征 (Gebru et al. 2017)、利用网站来绘制大规模家谱树 (Kaplanis et al. 2018) 以及利用在线图像数据来预测年龄等。计算方法也在发展以研究传统人口学中的生育、死亡和移民。为了研究生育率和死亡率,某些研究采用谷歌搜索数据和Facebook数据 (Hobbs et al.2016; Kashyap and Villavicencio 2016; Ojala et al. 2017)。其他研究则使用Twitter和LinkedIn的数据,对国家内部和国家之间的移民进行更准确的估计 (Palmer et al. 2013; State et al. 2014; Zagheni et al. 2017)。

讨论

作者认为这些文献回顾表明了社会学家不仅为计算社会科学贡献了新的方法,而且也取得了重大的理论进展,并且认为这是该领域继续扩展到主流社会学的关键。通过计算社会科学可以有多种方法取得理论上的突破。首先,许多研究正在使用新的数据和方法来重新审视那些曾经被认为不可能研究的旧的社会学问题,包括社会网络和文化变迁的宏观理论以及人类决策的微观理论。在作者看来,计算社会科学领域最有影响力的工作能够将文化变革等宏观层面的理论与微观层面的决策过程联系起来。计算社会科学推动社会学理论进步的第二个途径是发展数字技术本身所创造的社会领域的新理论。其中包括全新的媒介抗议理论、文化产品的消费以及网络知识的传播等等,以此考察政治、网络和通信领域的新空间。最后,社会学家可以利用计算社会科学的工具来开发创造理论本身的新方法。作者期待利用机器学习来识别社会行为的新维度、或测试现有社会的稳健性。最后,学者们还可以通过与其他领域的交流创造理论。例如,通过比较人类行为和人工智能的理论,可以发现关于社会生活本质的令人兴奋的新领域。沿袭该条理论,未来也许能精确地比较人工智能和人类之间的差异进而认识社会,特别是那些不容易表达或机器难以观察的社会过程。

政志观察

编译/Lance

原标题:《编译 | ARS新文:计算社会科学和社会学》

阅读原文

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈