澎湃Logo
下载客户端

登录

  • +1

知海图找寻指南针

2023-11-10 12:14
来源:澎湃新闻·澎湃号·湃客
字号

 撰文 | 吴坤谚

编辑 | 吴先之

11月的国内大模型赛道,开始“不堪重负”。

刚刚过去的一周,大模型赛道的消息就没有停止过。

创业派中有喊出“AI 2.0”口号的李开复,终于带领新公司零一万物正式开源发布首款预训练大模型Yi-34B。新一批通过备案的大模型玩家有知乎“知海图”、昆仑万维“天工”、网易有道“子曰”、360“奇元”、出门问问“序列猴子”等宣布即将面向全社会开放模型服务。

密集发布似乎昭示着大模型自今春后的又一个节点,可事实是大模型赛道已经“人满为患”,呆不下这么多玩家和业务了。

一则同样在周末开始发酵的消息是,阿里云将不再对外出租英伟达A100服务器,且官网下架英伟达A系列服务器云计算产品,未来或将停止或减少对外出租A/H服务器算力。

虽然百度云、腾讯云等厂商尚未发声,但摆在玩家们眼前的事实是,供给受限导致云计算厂商惜售。即使算力租赁日渐火热,行业短时间内也难以找到合适的替代品。

面对“无米之炊”的不确定性,一些后来者们需要在大模型对自身业务的改造以及商业化后的成本回收上找补确定性。

知海图找寻指南针

全面接入360搜索等应用的“奇元”可以参考百度,“序列猴子”对标微软Copilot,“天工”是通用模型底座,“子曰”结合智能教育硬件的路径也有科大讯飞作伴。

而知乎作为大模型赛道并不显眼的第二梯队,“知海图”还需要找到自身业务的参照物。

或因如此,具备海量中文优质语料数据的知乎在大模型的第一步便走得和别人不一样——知乎于今年4月测试了“热榜摘要”功能,即聚合优质回答的内容形成摘要,让用户更便捷地获取有效信息。知乎巧妙地通过内容聚合的方法,绕过了大模型为人所诟病的“幻觉”。

这一功能在当时似乎挑不出什么毛病,然而时过境迁,热榜摘要对如今的知乎显得有点鸡肋。

众所周知,知乎作为内容社区的核心竞争力在于创作者提供的多样化内容,社区内提问、回答、讨论的生态循环建立在不同创作者的不同认知上。然而知乎围绕“赞同”展开的内容分发方式,却在逐渐蚕食这种多样性。

进一步说,赞同固然可以筛选优质答案,但也不可避免马太效应之下的内容僵化。比较典型的场景是在一些早期问题中,部分答案在用户不断点赞下牢牢占据分发第一线。

热榜摘要聚合的内容自然是老回答、老观点的集合,进一步让内容板结。即使知乎可以通过推荐栏目为新回答纳新,但面对热门问题中成百上千条回答,其纳新作用可以说聊胜于无。

况且,内容聚合的目的是为了减少用户获取信息的成本。如果用户希望“看个大概”,很可能会看一眼热榜摘要即获取关键信息,从而“浅尝辄止”。如果用户希望找到有价值的答案,未标注出处的热榜摘要对用户的筛选过程并无作用,“大海捞针”找答案这样影响体验的情况依旧存在。

既有分发机制遇到瓶颈时,或许知海图的内容聚合功能更适合长篇回答场景,用户可以自行选择是否使用。当然,内容聚合并非知海图的唯一路径。在本次知乎释出的信息中,知海图还将改造更多业务。据了解,知海图对知乎的重构集中在内部提效、创作赋能与教育业务上。

内部提效方面,知乎称大模型应用已让分层、分类、兴趣理解等业务场景的人工标注量降低了90%以上,业务准召效果普遍提升15%以上,创作方面是为会员故事智能配图,教育业务则引入了AI批改、AI教务。

上述三种场景中,与商业化有强关联的仅教育业务一项。

向哪儿找增长?

面对老生常谈的商业化难题,知乎需要找到新的解法。

知乎对直播、短视频、电商三条移动互联网催生的赛道均有尝试,收效目前还不理想。据知乎2023年半年报,除却2022年初发力建设的职业培训外,其营收的主要构成仍是付费会员与营销服务。

作为目前知乎营收首要板块的付费会员,无论是收入还是订阅数都在二季度都出现小幅下滑。财报显示,知乎2023年Q2付费会员数环比下降6.04%,订阅收入环比下降了1.32%。而营销服务收入则同比下降了13.60%。

就目前知乎披露的大模型信息来看,内部提效显然与上述营收板块关系不大,更多是向资本市场讲述成本故事。那么智能配图与AI教育能否撑起目前押宝的短文赛道与职业教育赛道?

要给出这一问题的答案,知乎仍需时日。

诚然,为网文做AI智能配图的动作,我们能在阅文的大模型路径中看到,但阅文主打长文赛道以及其衍生的IP经济。长篇相对短篇更能深化用户对内容中的角色与场景的心智,“用户-角色”的破界更具想象空间,甚至能引导IP消费。

而知乎主打的是短文,两者形式之别也导向了不同的业务逻辑。据知乎官方介绍,“短篇一方面解放了读者,3分钟就可以尽享无穷世界、无尽反转和无限奇妙,降低了对世界观、人物设定、系统设定等元素的认知成本。”

作为网文界的“短视频”,知乎短文短平快的内容在IP变现上天然弱于长篇,但更善于引流与拉动会员订阅。充斥在抖音的引流短文让知乎的会员订阅收入于2022年成为营收首要板块,便是其业务逻辑的最佳佐证。

面对内容IP变现的挑战,知乎的解法是深度开发成熟IP,并且试图扩大内容生态。前者中已有作者@七月荔 小说《洗铅华》于2021年出版;后者则是通过“长篇创作马拉松”比赛等内容创作激励,鼓励创作者转向更容易打造IP的中长篇。

10月13日,改编《洗铅华》的短剧《为有暗香来》在优酷上线,作为知乎内容IP变现的范本,《洗铅华》实际上并不算短文,而是一篇总字数在20万字上下的中长篇。作为IP,《洗铅华》也是知乎自2019年沉淀至今的“三虐文”之一,其影视化道路走了足足4年。

知乎IP变现的布局在2023年Q2显现出会员订阅增长停滞后,势必会进一步加速。至于大模型在其中的作用,目前还看不到影子。

自知乎职业教育业务衍生的AI教育来看,业内也有网易有道与科大讯飞两大老牌选手借此杀进大模型赛道。但是两者拥有一个知乎目前尚未触及的大模型变现支点——终端硬件。以科大讯飞为例,搭载星火大模型的讯飞AI学习机的GMV在今年5月和6月分别增长136%和217%,但是知乎目前还缺乏这样的硬件基础。

此外,知乎与上述两者的用户群体也截然不同,大模型变现的难度也不可同日而语。

知乎副总裁张荣乐称,知乎面向群体以职人为主,也就是已踏入社会的、具备强烈职业教育需求的年轻群体,他们不仅是消费者,也是付费者和评价者。他们对知乎的职业教育成果、AI能力、内容生态的讨论广布于各大公域。

相比之下,科大讯飞学习机面向的是消费与付费相互格割裂的教育市场,因为作为实际使用者的学生人群没有决策权,真正有决策权的是家长与学校,可他们又不是核心使用人群。

教育焦虑在哪个群体中更容易兜售,一目了然。

知乎创始人周源曾在2023年新知青年大会“盐Club”活动演讲时表示:职业教育已成为知乎的第二增长曲线。然而大模型究竟能为这条曲线带来多少动能,目前还需要打个问号。

AI大多是“点缀”

知乎是大模型赛道中的一个不走寻常路的“异类”,而根源在于其业务的特殊性。但反过来看,我们也可以自知乎这个特殊案例中找到曾经互联网企业切入大模型赛道的一些共性。

首当其冲的是知乎的切入路径,知海图的诞生是知乎凭借自身数据优势,基于面壁智能打造的模型底座CPM-Bee与模型训练平台ModelForce训练精调而成。

作为模型底座赛道中相对低调的一员,面壁智能的模型能力频频在ZeroCLUE、C-Eval等测评榜单上刷榜,在证明其模型能力的同时,也凸显了当下大模型赛道虚火的问题。

一位业内人士直言,无论是模型底座还是结合垂直领域、业务后的精调,大家其实都差不多,处于可以解决8成问题的情况。这也是为什么各个测评集榜单会被千模大战中不同玩家反复刷榜——大家实力相近,你方唱罢我登场而已。

至于最尖端前沿的问题,“在商业化的迫切下统统丢给OpenAI”。那么留给玩家们相互比拼的空间在哪?

如果是to B方向,玩家们还可以相互比拼数据广度与深度,比拼模型团队在深度学习和专业知识两方面的深度理解。然而在本次讨论中的“面向公众服务”也就是to C方向,则更取决于自己的业务逻辑。

换言之,C端大模型赛道还做不到用AI“重构”业务,大多只能做到用AI“点缀”业务,逻辑本身没有变化。

在大模型赛道虚火蔓延的当口,知乎的当务之急是在内容生态与商业化两方面找到撬动大模型价值的支点。自行业视角看,在算力紧缺的当下,玩家们也恰是时候琢磨既有业务,沉淀数据资产,而不是一头扎进模型能力的内卷竞赛中。

市场需要大模型赛道给出一个高赞好评的回答。

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈