澎湃Logo
下载客户端

登录

  • +1

【财智头条】文心一言“顶风”发布,什么水平?

2023-03-18 21:00
来源:澎湃新闻·澎湃号·媒体
字号

图源:中国经营报

随着ChatGPT登台亮相,越来越多人再次关注到AI领域。百度“冲刺”推出了自己的新一代知识增强大语言模型——“文心一言”,但刚出道就遭到群嘲。

或许是吸取了谷歌因Bard产品在演示中“翻车”导致市值蒸发了1000亿美元的教训。3月16日下午,百度举行文心一言发布会,被寄予厚望的发布会没有产品现场演示,而是采用“Demo演示”的形式,用提前准备好的问题和答案做展示,瞬间引发众多吐槽。

不仅如此,很多对新产品跃跃欲试的用户们,被“邀请码”阻挡在了门外。直到晚间,才有极少部分用户真正“尝鲜”。

据悉,3月16日起,首批用户即可通过邀请测试码,在文心一言官网体验产品,后续将陆续开放给更多用户。此外,百度智能云即将面向企业客户开放文心一言API接口调用服务。3月16日起正式开放预约,搜索“百度智能云”进入官网,可申请加入文心一言云服务测试。

然而,一场50分钟的发布会,百度的股价宛如坐上过山车,在发布会进行的同时,百度港股股价一度下跌10%至120.1港元。截至16日收盘,百度股价下跌6.36%报收125.1港元。到了16日晚美股开盘,百度股价出现上涨,最终报收于138.16美元/股,上涨3.8%。

文心一言揭开面纱

在文心一言发布会上,百度董事长李彦宏坦言,对标ChatGPT甚至GPT-4,门槛是非常高的。但百度仍然是全球大厂中第一个做出对标ChatGPT产品的企业(微软是直接调用OpenAI的API)。

为了推出文心一言,百度很早之前就开始造势,发布会之前,已经有650多家国内公司宣布与文心一言合作。

2023年1月,百度内部开始正式规划用文心大模型整合出一款对标ChatGPT的产品。据悉,文心一言项目主要由TPG(技术中台事业群)、MEG(移动生态事业群)两大部门支持,百度CTO王海峰出任总指挥,团队核心成员还包括百度集团副总裁吴甜、百度技术委员会主席吴华等人。

在紧急筹备了近3个月之后,文心一言终于揭开了神秘的面纱。

发布会上,李彦宏展示了文心一言在五个使用场景的表现,包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。

在文学创作场景中,文心一言就《三体》内容进行了六轮对话。

在商业文案创作场景中,文心一言给公司起了名,写了一个Slogan,写出一篇新闻稿。

数理推算层,文心一言纠正了“鸡兔同笼”的错误提问,并展示了正确的步骤和答案。

值得一提的是,文心一言扎根于中国市场的大语言模型,因而具备中文领域先进的自然语言处理能力,在中文语言和中国文化上有更好的表现。在现场展示中,文心一言正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论,还用“洛阳纸贵”四个字创作了一首藏头诗。

除了日常的对话,李彦宏现场还展示了文心一言生成文本、图片、音频和视频的能力,还能够生成四川话等方言语音。不过遗憾的是,视频生成能力因成本较高,目前还未对所有用户开放。

“多模态是生成式AI一个明确的发展趋势。”李彦宏表示,“未来,随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力也会不断提升。”

据多家媒体实测文心一言,给出如下结论:常用功能表现正常,漏洞仍然不少。

在试用时发现文心一言在交流方面仍有不少漏洞,时常出现前后矛盾的现象。另外,在对话过程中缺少上下文之间的呼应,更像是一对一的应答。

图源:上观新闻

在先后输入“黄继光出生于哪一年”“北京明天天气怎么样”“刘备和曹操谁活得更久”等问题,以及提出“请写一篇文心一言PK ChatGPT的实测稿件”,“写一篇太空旅行的市场分析报告”,“生成一幅有马和飞机的水墨画”等操作指令后,文心一言先后给出的答案,有的表现相比此前OpenAI发布的ChatGPT也不遑多让,而有的则又相对存在不足。

以“中国人民志愿军特级英雄黄继光去世多少年”这一问答为例,文心一言给出的答案中,黄继光的去世时间为1952年,截至2021年已经去世69周年。而在由ChatGPT给出的答案中,黄继光去世的时间为2021年,明显与事实不符。

如李彦宏所述,作为扎根于中国市场的大语言模型,文心一言具备中文领域领先的自然语言处理能力。由于ChatGPT并不面向中国地区用户开放并做出知识内容优化,这为百度在中文知识问答领域的领先性,预留了足够的改进空间。

提问“明天天气怎么样”等问题时,文心一言列出的数据,与目前手机上显示的数据基本一致。而由于ChatGPT此前所收集的数据仅截至2021年,并不具备查询实时数据的能力,自然也无法获取到更加精确的天气预报这一类数据。

此外,相比ChatGPT更加擅长知识回答、代码写作等能力,内测时候文心一言所具备的以文绘图能力,在一定层面上超越了ChaGPT。虽然,目前OpenAI推出的GPT4大模型已经具备多模态技术能力,同样支持以文绘画能力。不过文心一言也嵌入了以文绘图能力,这也在一定程度上验证了文心一言的创新性。

不过,在中文知识问答、绘画以及实时信息获取等亮点之外,诸如ChatGPT此前被吐槽的“一本正经地胡说八道”“知识缺乏严谨性”等问题,也同样出现在文心一言身上。

提出“刘备和曹操谁获得更久?”这一问题时,由于错将“活”字写成了“获”字,文心一言却开始不假思索地给出了“刘备和曹操谁获得更多?”的长篇大论。而将问题更正为“刘备和曹操谁活得更久?”后,文心一言给出的解释,却多少存在一些“忽悠”的成分。

也有部分内测用户表示,同样的问题抛给文心一言和GPT-4,两者的答案有一定差距。比如《三体》的续写,“文心一言”的答案比较抽象,比如生命的意义、人类的宇宙关系,而GPT-4的回答更具体、更有冲突感,比如类人机器人的崛起、黑暗森林法则的挑战等。

此外,也有经过测试的业内人士表示,在多轮对话上表现与ChatGPT差距大。“这其实就像人类,一个已经会走了,一个刚刚开始学会爬。走和爬差几个月就感觉问题挺大,只有多‘虐’它,才会进步。”

业内预计,随着文心一言的逐步开放,将建立起真实的用户调用和模型迭代之间的飞轮,效果会迅速提升,模型有望变得越来越聪明。

文心一言逆风翻盘?

不过,文心一言这场发布会也为百度的股价带来了“灾难性”的打击。

就在发布会刚刚开始不久后的下午2:10左右,百度港股突然跳水下跌,一度跌近10%,随后始终在123港元/股左右徘徊,最终以报125.1港元/股,下跌6.36%收盘。美股方面,百度也在开盘前就开始走低,一度下跌超过6%。粗略计算,短短一下午,百度市值已经蒸发超过500亿。

在不少业内人士眼中,发布会似乎进一步“证实”了文心一言的不少功能与百度极为相似。李彦宏也在发布会中表示:“无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,没法速成。”

“股价的波动体现了投资者对于百度这款AI产品既寄予期望又担心失望的矛盾心态。”艾媒咨询CEO张毅说。

他认为,就百度港股目前的表现,投资者和市场信心明显。一方面,百度围绕AI前沿布局有技术储备和基础,另一方面过去不少AI商业化布局围绕toB方向,但这种招投标模式往往压价严重,导致不少AI企业至今没有实现盈利,但toC方向蕴藏机会。

如何看待百度在发布文心一言产品之后的股价波动?把这个问题抛给文心一言,这款AI产品自己给出的答案是:

“百度在发布文心一言产品之后的股价波动是正常的市场表现,因为投资者们对于人工智能和对话式人工智能产品的发展前景存在着不同的看法。

在发布文心一言之前,百度的主营业务是搜索引擎和互联网广告,这两个领域一直是百度的核心业务,但是随着互联网流量红利的逐渐消失,公司的营收增长面临着一定的压力。而文心一言的发布,被认为是百度在人工智能领域的一次重大突破,可以帮助公司拓展新的业务领域,提升公司的竞争力和市场份额。

因此,在百度发布文心一言之前,市场对其前景持乐观态度,股价也出现了明显上涨。而在文心一言正式发布后,市场对其前景的看法出现了分化,一些投资者认为文心一言并没有达到市场预期的效果,股价出现了下跌。但是,从长期来看,人工智能和对话式人工智能产品的发展前景仍然广阔,因此投资者们仍然对百度的未来发展保持了乐观态度,股价也出现了回升。”

当被问到文心一言还有哪些不足时,它回应称自己不是一个完美的人工智能语言模型,还有很多需要改进的地方。例如,可能会犯错误或者在某些任务中表现不够稳定,这可能是由于算法还不够完善或者数据集的质量不够高等原因造成的。此外,知识范围也受到所使用的数据和信息的限制。

同时文心一言的回复也充满“求生欲”,称“希望人们能够正确看待人工智能技术,认识到它并不是万能的,而是需要与人类合作才能取得更好的发展和应用。”

美东时间3月16日,以3.57%的跌幅水平低开,15分钟后,百度股价迅速逼平涨跌临界线。经过约1小时的多空博弈,最终多头占据上风,百度股价一路走高,至收盘报于138.16美元,上涨3.8%。

3月17日,港股百度股价也从前一日的下跌里来了一个大逆转,涨幅达13.67%。作为中国本土首款对标ChatGPT的产品,“文心一言”诞生的意义开始逐渐被资本消化并理解。

百度的焦虑

李彦宏曾在2023年初的内部大会上评论ChatGPT和AIGC:“这个事情很难,但百度必须要做。”

从全球互联网行业维度来看,ChatGPT的迅速发展,最先拉响警报的就是搜索引擎公司。

今年2月,谷歌就宣布推出Bard,并将其列为“code red”优先级项目,向ChatGPT发出了正面对决“邀约”。

实际上,真正让谷歌害怕的,是ChatGPT能够与微软紧密合作,嵌入搜索引擎必应、办公软件Office,甚至还将整合进入云平台中。微软CEO纳德拉宣布还将在云计算平台Azure中整合ChatGPT,宣告AzureOpenAl服务全面上市,届时微软的每个产品都将具备相同的Al能力。

更让谷歌在意的或许是ChatGPT还规划了广告功能,据路透社报道,微软已经开始与广告公司讨论如何从其新必应搜索引擎中赚钱的计划,如允许在搜索结果的回复中提供付费链接。

据了解,2021年,在谷歌的2576.4亿美元收入中,约80%来自广告。如此高额的占比一旦受到影响,谷歌将面临重大危机。谷歌第23号员工、Gmail创始人保罗·布赫海特曾表示,像ChatGPT这样的人工智能(AI)聊天机器人将摧毁谷歌,就像当初搜索引擎摧毁网络黄页一样。

而百度的处境则更为艰难。

2022年全年,百度的营收和净利润均下滑。2022年,百度实现营收1236.75亿元,同比下滑0.66%;归母净利润75.59亿元,同比下滑23.46%。

从百度目前的营收结构来看,由搜索业务带来的广告收入几乎是百度众多业务板块唯一一个实现规模化盈利的业务。无论是百度后续提出的百度云业务、智能汽车业务或是一直在讲的其他AI业务,都是持续烧钱,但少有进账的“苦生意”,在此前的年报中,这部分业务甚至被百度与爱奇艺一并归为其他业务。

其他业务层面的“前途渺茫”间接成为百度“掉队”的诱因,相当长一部分时间里,百度都被市场认为是一家“广告公司”,并被投资机构以此进行估值——BAT三家中,百度港股的市值仅有3864.64亿港元,与此同期腾讯、阿里分别为3.4万亿以及2.02万亿港元。

百度赖以为生的广告业务并非铁饭碗,百度搜索引擎的市场份额已经在逐渐下滑。市场调研机构StatCounter数据显示,从2022年1月至2023年1月,百度搜索引擎市场份额已经从84.36%下降至65.21%。

2022年全年,百度的广告收入在每一个季度均出现同比下滑。数据显示,百度2022年第一季度广告收入同比下滑3.6%、第二季度为10%、第三季度为4%、第四季度为5.2%。

上海市人工智能行业协会秘书长钟俊浩表示,相较同业公司,百度的集成优势明显,但同时也要看到,在每个层面,其产品能力是否都达到了最好。在OpenAI已经形成“暴力的算力美学”标杆之下,钟俊浩认为,短时间内,在大模型层面去做超越已经不可能,“也没必要”。对于百度,乃至更多中国的大模型企业而言,更多可以在OpenAI的短板领域弯道超车。

(微信公众号“财智头条”综合自:蓝鲸财经、上观新闻、第一财经、21财经、中国经营报等)

编辑:白静

校对:风华

审核:龚紫陌

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈