下载客户端

如何建立科学的数据和算法规制：从大数据杀熟说起

张文魁

2022-10-31 17:41

来源：澎湃新闻

人民视觉资料图

在数字经济发展中，数据正在成为关键投入品。本文将说明，数字经济领域一些比较典型的企业策略性行为，包括自我优待，“二选一”及其他形式的拒绝交易，大数据杀熟及各种花样的差别性定价，屏蔽、封禁以及拒绝链接等等，都与对数据和算法的利用密切相关；尽管传统行业也有一些类似现象，但对数据和算法的利用，可以将这些行为升级为系统性的竞争和反竞争手段，并可以以自动化、隐秘化的方法实施，从而发生了性质上的变化；因此，数字经济领域的反垄断与反不正当竞争，应该进一步聚焦于那些策略性行为背后的数据和算法。

同时，数据权属，以及数据所涉及到的国家安全等问题，虽然已经纳入政策议程，但如何正确认识并把握分寸，也需要认真思考。

一、数字市场典型策略性行为背后的数据与算法

事实上，在传统市场中，差别化定价和其他歧视性行为，以及自我优待，拒绝交易，等等，也屡见不鲜，譬如对于“熟客”给予优惠定价。而数字经济领域的“杀熟”，即对这类客户给予更高定价，就显得“离经叛道”了。但是，优惠定价和更高定价，本质上都是差别化定价，或者可以定性为价格歧视，那么为什么优惠定价不是问题，而更高定价却是问题？优惠定价虽然是让利行为，可以被视为一种“善意”，但也可以帮助厂商吸引更多高频次消费的稳定性客户，同样也可以起到压制竞争对手、强化本企业竞争地位的作用，从道理上来说也可以视为一种不正当竞争，更何况这样的定价对其他客户是一种不公平行为。

数字经济领域之所以存在较多的大数据杀熟，可能是因为，处于快速发展中的数字企业要大量“获客”，即获得更多的新客户，不得不对大量新客户进行补贴，以吸引他们加入数字化场景，并接受、喜爱这样的场景。对新客户进行补贴有一定道理，因为新客户从传统场景转换到数字化场景，存在转换成本，包括操作成本和心理成本。这意味着，对“熟客”的价格本来就是正常价格。因此，简单地将大数据杀熟定性为不正当竞争行为，的确存在困难。当然，还有可能是因为，许多“熟客”对特定数字化服务及其场景形成了习惯性和依赖性，或者他们对价格不敏感以及支付能力更强。这种情况的大数据杀熟，就与“获客”目的差别化定价大不一样。不过令情况更加复杂的是，也可能数字企业给予了接受更高定价的客户以更加特殊的增值服务组合。

但是，如果数字企业凭借对客户数据的广泛采集，特别是无授权、不知情的采集，而客户并未意识到这些数据及分析结果会用于企业的差别化定价策略，客户是数据贡献者，结果却成为数据贡献后的受害者，事情的性质就发生了变化。

很显然，大数据杀熟的要害不是“杀熟”，而是“大数据”。其他差别化行为的要害也不是差别化，而是数据；是数字企业，特别是互联网平台企业，广泛地采集客户和其他参与者的数据，并开发算法模型对数据进行有针对性分析，利用分析结果实施差别化、歧视性的定价行为。而且，数据的采集、分析、使用目的，一般而言并不为被采集对象知情和授权。

在数字市场中，其他的基于数据和算法的差别化和歧视性行为，也有不少。在双边性互联网平台市场中，平台企业对不同的上家和下家进行组合性定价，包括实施不同的组合性优惠措施，从而实现复杂的交叉补贴，使得平台可以追求利润最大化。这样的交叉补贴，如果不借助于数据和算法，是不可能实现的。基于数据和算法，可以比较容易地实现对优质客户的筛选，或者对脆弱客户的剔除，以及将那些易受诱导、易受情绪侵染的客户筛选出来并实行针对性高强度营销。

同样，可以进行反向操作，即对不合意，或者缺乏较好支付能力的客户，设法避免交易。这样的做法也可以发生在对上家的选择、对供应链的管理上。大量实施这些系统性行为，无疑可以强化互联网平台企业的谈判地位，弱化入驻平台的厂商和个人的谈判地位。平台企业如果还兼有自营业务，与入驻厂商存在竞争性，它也容易实施基于数据和算法的自我优待行为。

基于数据和算法的差别化行为，当然可以用于精准推送。精准推送大量存在于数字化新闻报道和信息资料的阅读领域，平台企业或者媒体机构对读者的题材偏好、关注点和兴奋点、阅读习惯等等，进行隐秘的数据收集，然后不断地向其推送同类的文章和资料。精准推送现在越来越普遍地渗透到购物、旅游、出行等订购领域，以及短视频观看和娱乐领域，并且伴随着越来越多的广告投放和高频度推销活动。精准推送显然免除了客户的主动搜索环节，实行基于数据和算法的自动匹配，在很多时候是一种可以极大提高效率的良性行为。但是，精准推送本质上也是一种差异化行为，而且基于数据收集实现对个体差异的识别，从而涉及到隐私问题，或者个体信息的非自愿公开等问题，所以可能是不良行为。那么，到底是提高效率的良性维度占上风，还是侵害个人隐私和违背个人意愿的不良维度占上风？这就给规制带来了难题。不过，未经同意的大体量、高频度的广告投放和信息推送，很可能违背了接收者的意愿，从而在较大程度上属于单维度的不良行为。

不仅是差别化、歧视性行为极大地受益于数据和算法，数字经济领域其他一些典型行为，大致具有同样情形。数字平台企业广泛存在的自我优待和拒绝交易行为，无疑是基于数据和算法。搜索引擎企业也具有同样优势。基于数据和算法的自我优待和拒绝交易，不但可以升级为系统性行为，而且可以自动地、隐秘性地实施，即数据的采集、分析、利用，并未得到客体的知情和同意，算法的使用，并未得到参与人的充分认知与自由选择。

尽管对数据和算法的利用，是极为重要的产业创新，极大地提高了生产和生活效率，但由于它们也隐藏在这些受争议、受关注的策略性行为背后，所以需要引入科学合理的规制，这不会抑制反而会促进创新。

二、数据和算法规制初探

毫无疑问，数据是算法的基础。要对数据和算法进行必要、合理的规制，首先就要探讨数据规制问题。

数据规制要建立并施行一套关于数据采集、流转、开发、利用的规则。欧盟于2016年颁布实施的《通用数据保护条例》，就是引入数据规制一个重要尝试，这部法律特别强调对个人隐私数据进行严格保护；其于2022年通过的《数据治理法》，初步建立了一个在数据保护基础上促进数据共享和鼓励数据利他主义的法律框架。中国于2021年颁布实施的《个人信息保护法》，也包含了许多重要内容。不过，由于客观世界可采集的数据无穷无尽，投射数据的客体，采集数据的主体，各自应该拥有什么权利、享受什么利益、担负什么责任，至少目前来看不可能由几部法律来详尽和准确界定。而且，数据流转会使原始数据投射物与数据的后续加工者、访问者、利用者之间关系越来越模糊，也会使数据的资产属性越来越强。未来，在数字经济发展中，会基于“对场景的尊重”(respect for context)，遵循“场景性正直”(contextual integrity)，在具体场景中实现隐私保护与信息采集和流转的合理平衡。

而对具体场景的判断，对场景性正直的把握，应该需要通过大量的法庭诉讼来积累，也就是说，对数据，以及对算法的规制，并不是狭义的行政规制，也包含诉讼与判决。因此，需要鼓励这方面的诉讼并培养大量的该专业法庭人才，以便在各当事方陈述、争辩并提供证据的过程中，逐渐建立科学合理的规制。

对数据进行挖掘和利用，才使数据有价值。而算法等技术，是挖掘和利用的集中体现。算法是数字经济领域最强大的竞争武器之一，例如，精准匹配可以极大地节约搜寻成本、提高配置效率，也是最强大的限制竞争、追求垄断的武器之一，例如，大数据杀熟、对链接的控制都是基于算法，而根据用户习性和弱点进行高频度推送从而形成致瘾性，则是算法滥用的典型现象之一。人工智能的快速发展和越来越强的渗透式使用，使得算法的威力更加强大，这种威力必将进一步超越经济领域，譬如，现在越来越多的人已经注意到了算法合谋问题，这种技术方法可以轻易突破传统反垄断法对共谋卡特尔的禁止。无论从哪方面来看，都需要给算法设立规制。（编注：卡特尔是指处于同一经济层次上的两个或两个以上企业所订立或进行的，旨在妨碍、扭曲、限制竞争或贸易的协议或任何共谋。）

欧盟有关机构在2019年提出的《算法问责及透明度治理框架》，对数字企业利用算法向用户进行内容推送的行为，提出了公平、透明方面的要求，要求它们在服务条款中说明算法决策的基本方法，并禁止某些特定决策仅由自动化方式作出。一些美国国会议员于2019年提出了《算法问责法（草案）》，旨在对基于算法的自动化决策所形成的歧视性行为和侵犯隐私行为进行规制。中国于2021年颁布实施的《互联网信息服务算法推荐管理规定》，要求算法推荐服务提供者，应当以显著方式告知用户其提供算法推荐服务的情况，并以适当方式公示算法推荐服务的基本原理、目的意图和主要运行机制等；算法推荐应当向用户提供不针对其个人特征的选项，或者向用户提供便捷的关闭算法推荐服务的选项。

欧美的上述政策性文件公布之后，引发了不少争议。这反映了算法规制之复杂和困难。算法规制的最大难点在于算法的不透明性和非人工性，因为许多算法决定，由通过处理大数据而进行深度学习的智能化机器所作出，有时连算法的创造者和设计者也很难搞清智能化机器为什么会作出某项决定，以及什么时候作出这样决定。算法程序还可以进行不断的快速更新，从而很难进行事前监管。即使数字企业通过算法实施不当行为，由于这些行为通过自动化程序而大规模和隐秘化地实施，监管部门要搜集足够有力的证据，也存在很高成本。或许，未来需要通过智能化程序，来对算法进行科学合理规制。这是一个“以科技之矛攻科技之盾”的方式，但需要花费很长的时间来等待。

对数据和算法实行规制，还面临一个重要议题，就是数据采集、流转、开发、利用，与国家安全之间的关系如何把握。尤其在中国，数据越来越多地被认为涉及产业安全和国家安全。中国于2021年颁布实施的《数据安全法》明确指出，对数据实行分类分级保护，关系国家安全、国民经济命脉、重要民生、重大公共利益等数据属于国家核心数据，实行更加严格的管理制度，各地区、各部门应当按照数据分类分级保护制度，确定本地区、本部门以及相关行业、领域的重要数据具体目录，对列入目录的数据进行重点保护；国家建立数据安全审查制度，对影响或可能影响国家安全的数据处理活动进行国家安全审查。2022年开始实施的《网络安全审查办法》也明确规定，网络平台运营者开展数据处理活动，影响或者可能影响国家安全的，应当按照这个办法进行网络安全审查。而关于工业领域的数据安全，有关部门还在制订《工业和信息化领域数据安全管理办法》等政策性文件。但是，数字经济具有天然的跨越物理隔阂、地理障碍的特点，数据的跨主体、跨地域、跨国界配置，是数字经济发展的强大内在趋势。对数据的跨境采集、流转、开发、利用，应该如何进行规制，远远超出了反垄断、反不正当竞争的范畴，未来将在较大程度上影响一个国家数字经济的全球化发展进程。

三、结语

上述分析表明，对数据和算法进行规制，应该成为数字经济中的关键性规制议题。但应该指出，这并不是说数据和算法注定是一种危害物，恰恰相反，它们是新的赋能工具。因此，对数据和算法的规制又不应该扼杀创新和促进社会福利的提高。而技术的革命性与颠覆性，场景的丰富性和复杂性，使得规制在兴利与除弊之间的平衡变得非常困难。从长远来看，在数字革命浪潮中，可能需要在全世界范围内建立一个数权（data rights）体系，就如过去几百年里，在工业革命浪潮中，建立了一个包括物权、债权、股权等权利主张的产权（property rights）体系一样。这将花费较长的时间，并将经历较多的纠葛。世界上最早、最完备地建立产权体系的国家是英国，这个过程经历了诉讼与判决互动、普通法与衡平法交织的数百年漫长时间。比较完备的数权体系的建立，尽管不需要上百年时间，但很可能需要几十年时间。

与数权体系相配套，可能还需要建立算责（algorithmic responsibilities）制度。数权和算责体系应该告诉人类社会，数据的权利如何分配、如何确定、如何保护、如何重置、如何获利，算法和其他此类的自动化、智能化程序产生的行动应该如何界定责任、追究责任。

尽管这是人类历史上一个前所未有的新范畴，不可能一蹴而就，但重要的是，应该树立这样的意识，并以这个意识引导人们迈出坚定步伐。而广泛讨论和无数回合，正是通向这个目标的道路。

（作者张文魁系国务院发展研究中心企业研究所副所长、研究员）

责任编辑：田春玲

图片编辑：陈飞燕

校对：栾梦

澎湃新闻报料：021-962866

澎湃新闻，未经授权不得转载

我要举报

#大数据“杀熟”#算法规制