澎湃Logo
下载客户端

登录

  • +1

12个国内外头部案例,解读自然语言处理平台商业化趋势

2020-05-10 21:02
来源:澎湃新闻·澎湃号·湃客
字号

原创 机器之心产业研究 机器之能

自然语言处理技术是人工智能技术的重要分支,随着自然语言处理技术本身的日趋成熟,一套相对完善的产业链也随之建立,从而催生了一批针对于自然语言处理技术的商业化产品,自然语言处理平台就是这样的商业化产品。相较于自然语言处理技术相关的软件和硬件产品,以自然语言处理平台为主的服务类产品占据着过半的市场份额,又因其本身的灵活性而具有无限的应用潜力。本文将对自然语言处理平台的市场现状、供应链以及行业技术热点进行简单的统计和讨论,并列举不同行业领域里不同维度上的自然语言处理平台的落地应用。

作者 | 于琳洋、田辰

自然语言处理技术及其市场发展

自然语言处理技术是指将人类沟通时所用的语言信息,经过处理转化为机器语言的过程。其作为人工智能技术的重要分支,在信息处理和数据提取中占据着重要地位。自然语言处理技术拥有众多细化技术分支,例如语音识别、语音合成、语义分析等。通过这些细化技术的互相组合,其能够实现社交网络文本情感分析、客户信息挖掘等更为复杂的技术应用。从市场发展角度来看,自然语言处理技术的市场基于技术本身的进步正处在快速发展期,市场利润空间成指数级增长,到2021年,全球市场年收入将超过70亿美元。市场架构主要分为软件供应商、硬件供应商和服务提供商。其中,相较于提供软件或硬件等直接支持的行业解决方案,提供自然语言处理平台服务以及其他相关数据或算法服务的企业占有超过50%的市场份额。

自然语言处理平台架构

将自然语言处理技术付诸实践并非能够一蹴而就,从最初的词袋模型根据字段出现概率进行分析理解发展至如今基于深度学习技术的自然语言理解,其模型构建流程都包含着五个主要阶段:获取语料,对语料进行预处理,特征化,模型训练,以及之后对模型的评估与调试。这套成熟稳定的技术流程促生了成熟的集成层次,针对不同应用场景的通用性自然语言平台加速了自然语言处理技术商业化落地的脚步。

自然语言处理商业化现状

目前为止,自然语言处理平台的应用分布于多个领域,且通过其细化技术任务的多种组合,使自然语言处理平台的应用成功落地于众多分散的细化应用场景。热点图数据来自于整理不同领域中的离散案例并对其涉及技术进行分析,并根据应用技术及相关场景的出现频率对数据进行颜色分级,由浅入深表示其出现频率由低到高。

自然语言处理平台商业化案例一览

搜狗知音自然语言处理平台

凭借着搜狗互联网公司文字信息获取的天然优势以及多年来的数据和技术积累,搜狗从2012年开始布局自然语言处理领域,并于2016年推出搜狗知音自然语言处理平台。搜狗知音自然语言处理平台主要聚焦于提供模块化的产品服务以及解决方案。目前,该平台以囊括语音识别、语音合成、语音分析、机器翻译等通用模块,以便让平台用户进行自由组合,从而构建符合其行业以及业务场景的客制化解决方案。近几年,通过客户的反馈,搜狗知音自然语言平台已形成针对文体娱乐、企业服务、科研教育等领域的专有解决方案,并推出了搜狗分身,搜狗同传等泛化行业垂直领域性解决方案以加快平台用户落地脚步。目前,搜狗分身与搜狗同传在传媒、教育、金融等领域都有离散应用落地。

央视财经与搜狗合作利用搜狗知音的搜狗分身所推出的AI主播“姚小松”,是基于央视主持人姚雪松的形象和声音,用人工智能技术合成的仿真AI主播。AI主播的背后,是搜狗分身通过语音合成技术模仿真实主持人的声音,通过文本语音转化技术,实现真人般的主播发声,并结合平台上的模型优化,使唇形、面部表情等与真人完全吻合,实现主播的“克隆”。除了“姚小松”外,同样基于搜狗分身的虚拟主播不仅在传媒领域被广泛应用,还在教育、金融以及社会服务领域都有相关应用案例。

讯飞开放自然语言处理平台

2010年科大讯飞率先对外发布讯飞开放平台,利用本身的技术及数据优势,搭建讯飞开放平台并提供相对完善的AI产品体系,提供语音识别、语音合成以及语义理解等AI技术接入。讯飞开放平台依托本身技术优势,针对不同行业以及服务场景都推出了丰富的技术模块产品与解决方案。平台不光有成熟的技术产品模块化服务(包括语音识别、语音合成、情感分析、关键字提取等),还可针对上述模块提供对应的管理软件以及硬件等一揽子服务。目前,科大讯飞不仅正在寻求通过自然语言处理平台构建覆盖该领域上、中、下游的全套解决方案,还希望该全套解决方案可以适应如健康医疗、文体娱乐、及企业服务等传统领域,从而进一步增强平台客户的粘着性。

科大讯飞利用讯飞开放平台开发语音电子病历输入系统落地上海瑞金医院,通过将自然语言处理技术与前端医生佩戴的麦克风硬件对接,在医生随身佩戴麦克风时能够分析来自医生和患者交流过程中的语音信息,自动过滤无关的闲聊语句,并将病情信息结构化的录入病例表格,正常情况下,医生问完诊,病历记录也基本完成了。基于讯飞开放平台的语音电子病历系统,总体上节省医生40%的病历书写时间。该系统输入高达1分钟400字,且系统内置百万级医学词汇,支持40种以上的标点符号的口述或自动生成。

Conversable自然语言处理平台

Conversable是针对与企业与客户间沟通的软件即服务(SaaS)自然语言处理平台。该平台可通过融合语义理解、文本挖掘、机器翻译以及文本生成等技术,实现多平台多维度的企业与客户对接。目前,该平台不仅可以帮助企业在不同场景下构建符合其需求的聊天机器人,还可实现评论、客户、市场监控等相关功能。

WingStop借助Conversable的自然语言处理平台,构建了适用于自身的社交媒体订餐平台。该平台不仅可以让顾客通过语音和文字完成下单、预定、缴费等多项功能,还可以帮助WingStop询问食客食品味道,过敏等相关问题以降低食品安全风险,以及食品生产成本。

吾来智能对话机器人平台

2017年,来也科技面向企业客户推出b端产品智能对话机器人平台“吾来”,以深度学习、强化学习、自然语言处理、光学符号识别等技术为核心,通过最领先的深度学习智能交互技术和支持人机无缝协作的系统实现,为企业提供高效专业的客户沟通解决方案;对话式用户交互,本质上是线下沟通和消费体验的线上化;从非结构化的对话中沉淀知识,基于大数据挖掘消费者洞察。帮助企业客户搭建、训练和管理对话机器人超级雇员,同时基于平台自身的核心技术,推出更直接的产业落地产品,目前具体解决方案包括营销场景机器人及客服场景机器人等。

学旅家是一个专门为全球留学生服务的海外住宿预订平台。学旅家的接待顾问通过官网、微信、APP等渠道回答留学生的咨询问题、收集留学生的需求,交由预订顾问为留学生匹配推荐相应的海外住房,并完成预订。但是由于淡旺季不同区域咨询需求差异大,仅依靠人力的咨询服务无法覆盖全区域的全时间段。因此,学旅家基于吾来自然语言平台创建了销售转化语音聊天机器人。该机器人利用吾来平台交互模块逐步引导用户提供基本信息及偏好,并在后台生成包含多方位信息的高质量线索表单,方便人工客服与销售进行更有针对性的线索转化。基于效果导向的设计,该机器人上线12周后,日均优质线索获取数量与上线前相比提升近30倍。

腾讯知文自然语言处理平台

腾讯知文自然语言处理平台的初衷是试图打造服务于企业内部的智能问答平台,随着自然语言处理技术的逐步成熟,该平台也开始兼容更多模块。目前,腾讯知文平台具有三层架构,由下至上分别为:基础会话模块,分析用户闲聊、以及用户间的情感联系分析;问答系统模块,提供智能搜索以及所需的会话模型;任务导向型会话模块,包括词槽填充、多轮对话以及对话管理。上述模块与架构让腾讯知文具备了从基础到高级的智能文本处理能力,可广泛应用于多行业以及领域针对用户评论情感分析、资讯热点挖掘、电话投诉分析等场景的需求。该平台已被应用于,通讯、金融、文体娱乐等多个行业,并与多家全球500强企业展开合作。

中国银行利用腾讯知文平台构建了支持电子渠道和电话渠道全系列的智能客服系统。该系统由全媒体坐席平台、运营监控、多媒体接入与统一路由、智能工单、智能门户、智能知识库、客户之声等模块组成,将手机银行、电话银行等服务功能整合。基于腾讯知文平台本身的技术优势,对于语音、文本及视频信息进行智能处理等项服务,开发基于自然语言识别的服务机器人,并与平安金服提供的智能知识库结合,为打造下一代虚拟银行、远程银行打下基础。自动服务机器人在平安银行营业厅投产后,有效的替代了繁琐的人工服务,方便顾客自动办理。

云知声智能开放平台

云知声的智能开放平台,从物联网数据出发,逐步构建了符合自身用户群特点的自然语言处理开放平台。该平台高度集成语音识别、自然语言理解、语音合成等技术,以深度学习、超级计算和认知计算为基础,构建其完整的AI体系,并可有效服务物联网领域的多项应用。目前,云知声依靠其平台优势,打造基于智能开放平台的语音互动机器人服务于多个场景,包括智能医疗、智能车载、智能教育等。除此之外,云知声推出通用行业服务机器人,除依赖本身平台的自然语言处理技术外,结合仿生肢体及视觉图形技术,应用于零售营销、餐饮住宿、金融、交通出行等行业中更细化的垂直领域。对于不同行业用户更加客制化的要求,云知声开放平台借助其与计算平台的计算能力和移动互联网技术,能够实现用户与设备之间更紧密智能的人机交互,帮助传统行业实现的联网化。

云知声为儿童早教公司所开发的教育机器人“聪聪”整合了云知声智能开放平台云因识别模块以及人机交互技术。现阶段,聪聪可以实现声纹+人脸认主、声源定位+人脸跟随,情感分析等功能,实现更个性化的人机交互。同时,聪聪还依托平台的KEROS2.0系统可实现读书互动、识物互动、口语学习等高难度自然语言处理应用任务。

武汉烽火普天ImageQ大数据语义分析应用平台

烽火普天推出的ImageQ互联网大数据语义分析应用平台专注中文自然语言处理和深度学习技术。其基于上述技术所构建的文本信息要素提取模块与数据挖掘模块,可适应多个行业的文本数据情报挖掘分析任务。由于武汉烽火普天的客户多为党政机关和国企,所以其ImageQ平台的发展策略在注重自然语言处理模块构建的同时,更着重于信息安全与可靠性验证相关技术的发展。目前,ImageQ平台的合作伙伴已覆盖中国超过半数的地区党媒,主要关注于舆情演练和媒体数据挖掘场景。与此同时,由于该平台的安全性,公共安全与安防领域的落地案例也与日俱增。

在安防领域,公安系统非结构化数据占比高且传统侦防工作高度依赖人工,案例由大量的文字描述构成,为了获取关键线索,不得不依靠人工检阅海量案卷数据。ImageQ通过挖掘业务过程中产生的非结构化文档数据中案件要素、特征及线索,从过去的案件语料中提取语义要素,然后进行语义关联,在进行深度挖掘便可应用在刑侦情报中,同时结合公安系统的大数据数据库,为侦查人员提供智能的分析手段。此类解决方案已经在湖北公安,湖南公安等多个省级公安系统得到了落地。

Amazon Alexa 自然语言处理平台

Alexa是亚马逊为了支持其智能音箱硬件推出的开放性自然语言处理平台,Alexa框架分为三部分:Alexa平台框架是亚马逊的语音服务框架,是整个Alexa最核心的部分;Alexa Skill Kit作为亚马逊提供给语音服务应用开发者的工具包,能够吸引个体开发者对Alexa的功能模块进行补充;Alexa Voice Service需要集成在物联网终端设备中,是亚马逊提供给终端设备的服务。Alexa通过自动会话识别和自然语言理解引擎,可以对语音请求及时识别和回应,目前,Alexa已经与多家通讯、电子消费产品厂商达成合作,将使用其自然语言处理平台进行相关产品开发。

利用Alexa平台及与其搭配的硬件设施,amazon 推出了一系列语音处理相关的附属功能,针对多个行业的不同垂直领域。Alexa for business是Alexa在企业服务领域的一个典型应用,主要针对企业会议场景。EnergyBBDO公司购买Alexa for business服务后,通过智能语音识别及人机交互系统实现了公司会议全场景自动化、智能化。系统能够更直接的预定会议室并启动电话会议,通过分析获取的环境声音信息自动取消已预订但无人参加的会议室。同时在企业会议期间,alexa for business还可以对会议内容进行记录整理。目前。这一系统已经在多家企业落地,例如EnergyBBDO和Gildewell Dental等。

紫平方语音交互智能机器人平台

紫平方自然语言处理平台的侧重点主要是在语音交互方向,并试图实现针对企业级用户的自动化解决方案。为了能够提高自身语音交互平台中对语义理解的准确度,紫平方同时也构建了不同细分行业的知识图谱,自主提升意图判断的学习能力。同时,紫平方平台还应用TTS文本转语音技术,实现全变量模拟真人发声,提升服为不同垂直场景中的合作方提供智能交互、情感问答的对话系统,有效的满足用户多元化对话的需求。目前,平台集成了完整的自然语言处理、机器学习、知识挖掘等技术,并覆盖了儿童教育、银行服务、市场营销等多个行业的众多垂直领域,以帮助用户通过前端与后台业务意图搭建客制化自然语言处理自动化解决方案。

中财讯智能科技股份有限公司基于紫平方语音交互智能机器人平台推出了智能财税机器人“i财”,是中国同类机器人中首台具有深度学习能力的人工智能财税机器人。“i财”机器人借助紫平方平台的自然语言处理模块,能够实现数据实时抓取,数据挖掘分析,基于其对文本数据的自动化处理,并可自主完成账务处理、财务状况分析、纳税风险评估、等多项人机交互任务。

Google Dialogflow 自然语言处理平台

DialogFlow 是Google提供的自然语言处理服务平台,其前身为Api.ai,通过谷歌的深度学习技术以及谷歌云的支持,平台已构建可实现对文本语义理解,文字转化,以及文字处理等多项功能模块。目前,Dialogflow 自然语言处理平台可适用于针对网站、移动应用、热门消息传递平台和物联网 (IoT) 设备创建对话界面的聊天机器人以及语音交互功能的开发。近几年,DialogFlow已被成为多个行业另有构建自有聊天机器人、对话个人助理等系统的自然语言处理服务供应商。

荷兰皇家航空公司利用Dialogflow自然语言处理服务平台的语音与文字文本处理推出了自己在Facebook Messenger上的首个预定机器人——Blue Bot。Blue Bot可基于Dialogflow的人机交互功能模块实现与潜在客户的文字聊天交流和客户需求梳理。Blue Bot还可利用文本处理模块实现信息归类,并将有价值信息直接发送至荷兰皇家航空的CRM系统。

Wit.ai 自然语言处理平台

Wit.ai 是 Facebook 旗下的一家AI公司,它自然语言处理API 平台,可帮助开发者便捷的打造例如 Siri 语音、小冰等对话应用或设备。Wit.ai的自然语言处理平台包括意图识别、实体抽取、文本挖掘以及情感分析等API接口,可供任意第三方应用提供对应服务。目前,该API可支持iOS、Android 等多种操作系统。与此同时,该平台还推出了bot engine模块可帮餐饮住宿、交通出行以及健康医疗等行业急速开发聊天机器人,并投入运营。

Babycenter母婴类产品网站利用Wit.ai平台的bot engine模块构建了可工作于Facebook上的语音聊天机器人。它不仅可利用自然语言处理技术持续不间断回答育婴过程中客户所遇到的疑难知识邮件,还可链接后续对应的知识库,帮助网站客服人员回答简单的客户问题。

AliNLP自然语言处理平台

阿里巴巴为了适应自己复杂的电商生态推出了AliNLP自然语言处理平台。该平台框架可分为三层:底层是各种基础数据库;中间层包含基本的词法分析,句法分析,文档分析等基础自然语言处理技术;而上层则是针对不同行业垂直场景的大业务单元,例如智能交互,舆情监控等。同时,AliNLP自然语言处理平台还将着重发展服务于通用场景的应用服务模块,以便更好的切入传统行业领域。

淘宝网“阿里小蜜”是基于阿里巴巴的AliNLP自然语言处理平台所开发的人工智能客服。整个阿里小蜜系统由三个服务模块构成:助手服务、用户服务、聊天服务,并可根据数据与对应知识库有效自主服务于客户与商家之间。系统可通过知识图谱内容抽取以及形成开放域对话系统解决零售服务中近95%的客服用户请求。目前,阿里小蜜已替代大部分的淘宝人工客服,实现了从纯人力到智能+人力的客服场景转型。

自然语言处理平台局限性和发展趋势

语义、数据与符号边界,让自然语言处理平台受地域限制:不同地区所开发针对本区域内使用的自然语言平台应用模块,在向不同语种区域延展的情况下会受限于平台的自然语言处理基础技术能力。

算法通用数据化,让自然语言处理平台较难进入特定领域:自然语言平台已然在零售、金融等行业应用渐入佳境,但在如心理诊疗,情感调节等特定情感感知、人与人交流领域还存在局限性。

深度学习与开放数据源的相互相成:语言结构,情感分析,跨语种转化,正在成为自然语言处理平台扩张的拦路虎,但随着深度学习与开放数据的广泛应用,将有效解决端对端数据不充分等边界问题。

通用化,跨界应用,价值变现:现自然语言助理平台一般都有自有专精的行业应用方向,而随着信息技术的突破,跨界通用化的自然语言处理平台将会出现,并将加速平台变现和扩张速度。

* 本文为「智周」系列报告「核心版」,相应「深度版」的推出计划将在后续公布,敬请大家关注。针对「自然语言处理平台商业化」这一主题,有哪些方向或主题,你希望在报告深度版中读到详细的阐述与分析,欢迎留言,这将成为我们制作报告深度版的重要参考。

关于「智周」系列报告

机器之心「智周」人工智能技术应用报告系列重点关注现有人工智能技术应用较成熟且应用潜力较大的正在进行智慧升级的传统行业及场景,逐行业、逐场景为产业用户高效而不失深度地呈现不同人工智能技术的产业落地现状、企业案例、技术应用趋势等。「智周」人工智能技术应用报告系列包含核心版及深度版两个版本:

核心版浓缩精华分析内容至2页内,覆盖重要数据、分析结论及案例简述,以供使用者高效系统地了解人工智能技术在自身所关注产业内的潜在机会。

深度版在核心版的基础上,包含详尽的行业或场景痛点分析、技术解读、落地案例详解及资料附录等,以供有深度研究需求的使用者进行深入探究。

▼ 专题推荐

算法攻破人脸识别「口罩」难题2020-02-18

大疆为6亿平米土地筑起「防护墙」2020-02-12

CT+AI双拳出击攻破假阴性困境2020-02-10

原标题:《12个国内外头部案例,解读自然语言处理平台商业化趋势》

阅读原文

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈