澎湃Logo
下载客户端

登录

  • +1

产业与治理|破解信息茧房,优化互联网信息服务算法推荐

陆绮雯  许鑫
2023-01-09 14:39
来源:澎湃新闻
全球智库 >
字号

在互联网信息量和增速快速扩展的当下,信息传播模式由主动发现到被动推荐逐渐转变,平台开始基于推荐算法打磨社会注意力的新机制,而与此同时信息接收的机械化处理可能会造成一定的信息聚集或信息窄化的“信息茧房”问题。关于“信息茧房”的效应,存在正面和负面两个方面,而当前学者的研究存在负面偏向性。本文关注信息茧房的二面性影响因素,以信息传播路径为脉络,为算法推荐治理的系统性优化提出建议。

一、  关注算法推荐治理中的信息茧房问题

1994年互联网接入大众生活,海量信息扑面而来,信息化从量上实现突破。2009年移动互联网让大众随时随地获取信息,永久信息连接进一步带来质的飞跃。面对如今的大数据时代,如何在信息爆炸背景下为用户输入高价值信息,成为互联网平台的探索方向。互联网信息平台以算法推荐的模式作为主要方法,让信息传播从“人找信息”转向“信息找人”。推荐算法一方面变更了信息传播的原有秩序成为当代信息传播的灵魂,让用户快速定位自己的兴趣圈,捕捉核心内容,但一方面其也限制了大众接触信息内容的多样性与主动性,造成信息茧房,恐引发系统性风险。

信息茧房问题自虚拟网络的兴起便长期存在,“网络巴尔干化”、“围墙花园”、“过滤气泡”等描述均是指代这类不同子群内部的信息接收封闭。随着互联网平台的普及与推荐算法的高度渗透,这种封闭现象愈发显著,人们被动性地被信息引导,从而将自己的生活桎梏于像蚕茧一般的“茧房”中。对于个人,信息茧房会造成认知上的偏误与窄化;对于平台,可能会触发偏倚性的引导;对于社会,已有民主情绪、政治事件、网络公共领域、侵权纠纷、算法纠纷等案例摆出。信息茧房问题的产生,与互联网信息算法推荐的便民性背道而驰,不利于提供给广大人民群众高质量的互联网信息服务。

二、  推荐算法对信息茧房效应的二面性影响

当前产学界已有多数研究重点关注信息茧房带来的不良效果,中国政策层面也出台了《互联网信息服务算法推荐管理规定》对算法推荐进行一定的监管把控。但是实际场景下,信息茧房假说未能形成明确概念,并没有直接证据表明个体会放弃具有外部性的信息,相反,某些场景下信息茧房具有深度认知和提升参与性的优势。因此,需要对信息茧房的正面影响机制与负面影响机制展开分别讨论,探究如何通过治理的组合路径实现正面效应最大化,负面效应最小化。

1.  信息茧房的二面定义

本文将“信息茧房”在正面视域下定位为:在大众面对“信息爆炸”与“信息超载”环境下,通过算法技术或个人特征选择等因素,对信息产生的过滤机制的结果,帮助大众从繁杂内容转而聚焦收拢的信息聚合现象。在负面视域下,定义“信息茧房”为:在技术与社会网络群体发展过程中,信息类型从多元化向单一化,导致大众在判断中发生信息偏食、知识固化、个性偏执等困境的信息窄化现象。

2.  信息茧房的影响因素

依据信息传播的路径对信息茧房的影响因素展开调研,从“信息生产—信息传递—信息消费“三个阶段关注信息茧房的正负两面性。

信息生产阶段,用户的主观信息类型需求和信息接收形式的需求是信息茧房形成的重要骨架,推荐算法推荐的内容是否丰富、充分、实时,可能是用户主观决定前的重要一环。也有学者指出,由于算法的出现改变了信息内容的生产方式,当平台采集渠道的不适,将带来相应的阅读“暴力”问题,绑架式阅读导致视野窄化和认知偏执。学界以新闻客户端为研究对象出发,也观察到不同平台内容的差异化,其中蕴藏价值导向偏离、低俗信息增多等伦理问题。

信息传递阶段,个性化推荐算法在从稀疏关系矩阵中挖掘有用信息的过程被概括为过滤机制,一方面,过滤机制为用户挖掘了潜藏的“暗信息”,协同化又可以扩大用户的兴趣,而另一方面单一算法的偏差性自定义标签将带来大量的信息垃圾。在过滤完成后,算法将依据一定的推送规则将信息传递至用户面前,基于社会网络与关联规则,算法将人群集中化,聚合同兴趣小组的获取内容。

信息消费阶段,为保障消费者的信息权益,《互联网信息服务算法推荐管理规定》中明确指出,算法推荐服务提供者对用户个人特质做出限制或提供关闭选项,以保证算法消费过程的道德合规性。此外,基于用户画像,对用户标签做出管理也是推荐算法的重要一环,特殊标注、隐私政策、隐私标签、匿名化处理均是用户知情权,隐私保护的关键点。

表1  信息茧房影响因素

3.  信息茧房的影响机制

基于上述调研,以信息传递过程为框架,形成“信息茧房”影响机制框架如下图所示。信息生产方面需要对传入推荐算法的数据来源做出评估,影响因素包含传入数据来源的多样性,数据内容的分散程度;信息传递过程中,需要对推荐算法的算法机制进行探究,一是过滤机制是否是多种算法的混合,单一的过滤机制存在一定的片面性,二是推送机制是否对用户实现了协同避免陷入单用户困境;在信息传递至用户进行消费的阶段,推送机制中是否有用户标签管理,是否依据法律法规进行规范,是否有让用户自主进行开关的干预机制,都是对互联网信息服务信息茧房影响评估的重要影响因素。

图 信息茧房影响机制框架

为进一步探究推荐算法不同因子对信息茧房的多变量影响路径,课题组选取《境内互联网信息服务算法备案清单(2022年8月)》中披露的个性化推送算法类披露文件中17家企业备案信息为样本,采用QCA定性比较分析方法进行分析评估。以推荐算法影响因子为自变量,分别探究信息茧房的负面影响与正面影响,最终得出1条显著的负向管理措施及7条显著的正向组合治理方案,可将结果归纳为三点:(1)把握伦理守则与干预机制是抑制信息茧房负向扩张的关键控制手段;(2)依据信息生产环节的采集来源分为两类,聚合性来源互联网信息平台,需在信息生产环节进行数据打散并在消费过程中形成差异化的标签管理;(3)自主内容生成类互联网信息平台,需着重关注推送机制或过滤机制上的混合处理。

三、  互联网平台信息服务算法推荐治理建议

1. 增强对平台伦理偏误的监督与网络文明引导建设

治理路径上,政府需要形成一定的伦理守则与干预方案。以当前的干预手段为例,前期用户对于平台的个性化推荐信息主要以被动接收的方式获取,当推送的信息内容存在恶意误导,隐私侵犯、过度宣传时,用户将被暴露于选择同质化与认知极化的风险中,而伴随着《互联网信息服务算法推荐管理规定》的正式实施,本次17家调研的平台均在实施后陆续上线“个性化推荐”开关,极大降低了用户对于信息接受的心理负担与心理依赖。因此,对于平台的信息茧房负面性,仍需要依据监管手段与整体文明建设来进行消解,对虚假信息形成有效监督,对防止沉迷进行门槛设置、对过度消费进行合理控制。

2. 提升信息聚合平台在输入与输出节点的打散机制

信息聚合平台以垂直类服务为基础,常见的包括新闻类平台、求职类平台、母婴论坛等,其以外部信息采集、内容主题相似、群体需求同质化为特征。以今日头条为例,其作为国内首个基于推荐算法自动分发机制的新闻客户端,当前已拥有1.4亿活跃用户且每人每日平均时长高达76分钟。今日头条通过大量采集即时性的外部新闻,并基于个人搜索记录、访问记录、查看记录等行为数据,为用户打造个性化的个人标签,实现用户专属的个人日报。

以新冠疫情时期为例,当在输入端大量收集同质信息且缺乏信息打散,输出端对用户的标签管理过度关注信息浏览动态而缺少主动寻求与属性性质的管理时,造成用户的信息获取封闭圈,给用户带来极大的回避心理,特殊时期甚至带来了认知层面的创伤。因此,对于垂直类平台需要信息采集阶段更着重内容的打散规避输入上的单一,可以在输入源上增加相似性探测,避免造成传递中推荐协同和过滤机制的无效,也需关注在用户消费阶段用户画像的管理模式,把控行为数据与偏好数据、个人数据的比重,防止因个性化而限制多元化。

3. 优化信息自生产平台的信息传递协同与混合性

针对UGC为代表的内部信息生产平台,在算法规范限制时应注重信息传递过程中的用户协同过滤与推荐算法混合制度。以抖音个性推荐算法为例,其通过深度学习技术框架建立模型预估了用户对某个内容产生互动的概率,设置相互用户间的协同策略,对预估内容进行过滤。同时,为规避“信息茧房”负面问题的产生,其在推荐机制中设置了一定比例的兴趣探索内容与不常观看内容,实现了内容上的多样。依据此类过程,不仅保障了用户信息接触的深入程度,也潜在扩大了兴趣圈。相较单一过滤带来的信息收口,信息传递中协同与多样混合机制,将提升信息服务的优质性。 

(作者陆绮雯、许鑫均来自华东师范大学经济与管理学部。“产业与治理”专栏由华东师范大学许鑫教授主持,关注新技术、新产业、新业态、新模式等新型经济形态,关心新兴技术治理,探讨科技创新在经济社会发展中的前瞻性问题。)

    责任编辑:田春玲
    图片编辑:张同泽
    校对:丁晓
    澎湃新闻报料:021-962866
    澎湃新闻,未经授权不得转载
    +1
    收藏
    我要举报
    评论0
    发表
    加载中

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2023 上海东方报业有限公司

            反馈