澎湃Logo
下载客户端

登录

  • +1

前微软亚洲研究院副院长创办企业推出“孟子对话大模型”

澎湃新闻记者 邵文
2023-03-15 11:39
来源:澎湃新闻
未来2% >
字号

·澜舟科技创始人兼CEO周明表示,ChatGPT是AI 2.0时代工具端井喷中出现的第一个现象级应用,带动着更多AI 2.0时代的语言大模型能力持续演进。

·据介绍,孟子对话大模型(MChat)有类ChatGPT的能力,同时具备原有的孟子多项目功能引擎。“两者结合使得其具有ChatGPT的对话能力,又同时具备工业级尤其To B服务器所需要的翻译、生成、信息搜索等方面的能力。”

3月14日,创新工场董事长兼首席执行官李开复在北京创新工场总部举办的 “AI 1.0到AI 2.0的新机遇”趋势分享会上提出一个观点:在深度学习的重大突破之后,AI已经处于从1.0迈入2.0的拐点。

澜舟科技创始人兼CEO周明。

澜舟科技创始人兼CEO周明则在这场分享会上表示,ChatGPT是AI 2.0时代工具端井喷中出现的第一个现象级应用,带动着更多AI 2.0时代的语言大模型能力持续演进。

当天,周明公布了两个消息:澜舟科技正式完成了Pre-A+轮融资,不到一年时间,融资总额达到数亿元;推出孟子对话大模型(MChat)。

孟子对话大模型(MChat)展示demo。 来源:澜舟科技(00:51)

MChat底层是“通用底座”

2020年底周明从微软亚洲研究院辞职后,孟子通用预训练模型开始孵化,2021年4月正式推出。2021年6月,10亿参数的孟子轻量化预训练模型在CLUE(中文语言理解测评基准)的任务比赛中获得第一。2022年8月,孟子预训练模型获得ZeroCLUE(Zero-Shot Learning,零样本学习)和FewCLUE(小样本学习)榜单第一。这也是ChatGPT推出以后,澜舟科技广被关注的原因。

在分享会上,根据对孟子对话大模型(MChat)的正式介绍,其有类ChatGPT的能力,同时具备原有的孟子多项目功能引擎。“两者结合使得其具有ChatGPT的对话能力,又同时具备工业级尤其To B服务器所需要的翻译、生成、信息搜索等方面的能力。”

李开复表示,以基础大模型为核心的AI 2.0时代已经到来,并极有希望成为有史以来最大的技术平台,重塑各行各业,提升整体生产力。在这个全球兵家必争的未来产业赛道上,澜舟科技以MChat可控大模型构筑了一个相对完善的可控大模型生态链。

据介绍,MChat大模型提出的“可控”特色,是指其能力相较于其他同类技术更为灵活,面向垂直领域、专业赛道落地会更加聚焦,可以根据行业、地域等需求做出快速调整。

更具体而言,MChat大模型底层是个“通用底座”,提供了涵盖语言预训练模型、多模态预训练模型、垂直领域预训练模型和其他预训练模型等能力。在通用底座之上,架构“能力平台”提供了知识图谱、辅助写作、机器翻译、情感分析、智能检索、智能客服、文档解析等多领域的模块化能力。

在面向银行客服、智能投研、行业搜索、AI辅助写作、AI绘画、智能营销等垂直场景时,MChat大模型可根据场景实际的需求和规格,将上述的能力模块进行更灵活更可控的组合。

AI 2.0时代出现“涌现”能力

2020年年底,在微软亚洲研究院从事自然语言领域工作逾21年之后,周明辞职创业,专门从事大模型研究。

周明是在微软亚洲研究院(MSRA)创立的第二年(李开复于1998年在中国创建并出任院长)加入的,此后出任微软亚洲研究院副院长。在微软亚洲研究院的21年,周明实现了自己的两个“小目标”:与MSRA的同事们一起努力,将他所带领的自然语言处理(NLP)小组带到世界顶尖水平;努力促进中国的NLP研究进入世界一流水平。

周明在2021年创办澜舟科技,他的创业得到了李开复和创新工场的支持。澜舟科技希望以NLP技术为基础,提供新一代认知智能平台。其主要产品是基于“孟子大模型”核心技术打造的一系列能力平台和垂直场景应用。

“AI 1.0时代,NLP具体模型做任务时,无论用规则的方法还是早期的大模型,基本是一个任务一个模型,或者说为每一项任务开发一个模型,定义了要解决什么样的问题,也就只能解决这样的问题。而且既然定义了能力范围是85%,那就不会突然产生跃迁到达90%以上。”周明在分享会上表示。

而在AI 2.0时代,NLP领域出现像ChatGPT这样的通用模型,可以一套模型解决很多问题,效率大幅度提升。周明注意到,第一是其能力足够强;第二是出现“涌现”能力,即模型已有的能力会产生跃迁,而且会迸发出一些从未见到的能力。

“不同的涌现能力对模型的要求不一样,有些涌现能力需要60亿参数,有些则需要百亿到千亿参数。一般来讲我们认为是百亿,所以做大模型的公司一定要从10亿模型做到百亿模型。”周明说。

周明提到,AIGC(人工智能生成内容)正开始重塑一些赛道:

第一,AI 2.0时代创作内容的革新。虽然说ChatGPT只是AI 2.0时代的一个内容工具端的应用体现,但它背后所体现的AIGC对创作内容的重塑能力已经可以管中窥豹。AIGC从文化创意领域已经开始拓展到大文娱、影视传媒等多个产业,其不仅能带来更加实时、高效、批量的规模化内容生成,也能在创意方面作为人类创作者开拓灵感的得力助手。

第二,AI 2.0时代办公方式的革新。AI辅助写作、AI图形图表生成、AI辅助公式计算等生成式AI让用户更加专注自己的业务领域,把繁琐的生成工作交给AI,让用户工作成果的产出和展现更加高效与精确。

第三,AI 2.0代重新定义搜索引擎新范式。从关键词匹配到语言理解,NLP、搜索不再仅仅是体现相关性,进一步将语义、知识融入搜索过程和结果,形成更具深度及广度的洞察。在信息、知识的基础上,能够结合更大时间空间范围的大数据进行推理和趋势预测,并可直接生成答案回复。

    责任编辑:郑洁
    校对:栾梦
    澎湃新闻报料:021-962866
    澎湃新闻,未经授权不得转载
    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈