澎湃Logo
下载客户端

登录

  • +1

阿里筹建两个实体声学实验室,前中科院研究员付强带队加盟

澎湃新闻记者 杨鑫倢
2018-05-03 11:23
来源:澎湃新闻
10%公司 >
字号

阿里巴巴又招来一位“大牛”,计划推进语音识别技术的场景落地。

5月3日,阿里巴巴宣布全资收购语音解决方案创业公司北京先声互联科技有限公司(以下简称先声互联),先声互联创始人、中科院声学所前研究员付强博士,近日入职阿里达摩院机器智能技术实验室,负责语音交互前端处理技术和方案的研发。

阿里巴巴表示,付强加盟后将整合资源,推动语音识别技术的场景落地,形成软硬结合、端云一体的商用方案。他还将筹建两个实体声学实验室。

付强告诉澎湃新闻记者,相比国外,中国在语音处理相关技术的积累并不落后,但缺乏成功的产品带动。

“我们在中科院声学所时,团队在前端处理技术环节上就比较成熟了,在信号处理与唤醒和识别等语义层面的信息融合方面还是更进一步的,也借此落地了不少实际产品,但由于语音交互技术链条很长,在缺乏对端到端交互系统流程把控和优秀的产品设计前提下,一些更好的想法很难体现出来。”付强表示,相信在阿里这个大平台会有更好的机会发挥价值。

中科院声学所前研究员付强团队

和付强一同入职的,包括先声互联创始团队的5名资深专家,其中4人为付强在中科院的原班人马,有一位来自著名的杜比实验室。

先声互联是国内最早从事语音增强、远讲语音交互接口技术的团队,曾为阿里、百度、小米等多家公司提供远讲语音交互软硬件的解决方案。

付强及团队在语音增强等领域创造了多项国内第一,甚至打破了国外的技术垄断。创始人付强拥有20余年语音信号处理研发经历,在美国OGI等语音研究机构从事过博士后工作,曾牵头完成了国家自然科技基金国家、省部委几十项科研课题,在包括IEEE Trans.在内的国际权威学术刊物上发表论文近百篇,发明专利近20项,多项成果被相关部委列装。

4月初,阿里宣布全面进军物联网领域。阿里巴巴表示,付强带领声学团队加入,将成为阿里IoT(物联网)场景落地的重要一环。

据介绍,付强所加入的机器智能技术实验室,短期目标是帮助语音交互技术在多种场景和终端上落地,在复杂环境下保持正确的识别率,比如去解决地铁机场、家庭、车载等各种不同噪音环境下的语音识别问题。

关于筹建的声学实验室,付强透露,声学实验室主要目的是用于复杂声学环境下的语音交互系统在线端到端测试。有别于现有的远讲语音交互测试认证方法,它的主要特色是基于多扬声器系统声场重建的原理在局部区域内建立真实的声场,也就是说家庭、车载和户外等场景的声场条件,使得待测终端在实验室内就能置于近似真实的声场中。在此基础上,更重要的是建立自动化的,包括前端信号处理能力、唤醒率、识别率乃至对话成功率的,全链路端到端测试系统和流程。

2017年下半年,前宝利通首席工程师冯津伟加入阿里,进行上海地铁语音售票机的研发,这是全球首个强嘈杂环境下的语音交互产品。

付强介绍,针对IoT化的智能家居的需求,他们正在研发基于小阵列语音增强技术的低功耗、低成本、高集成的端云一体语音交互技术和硬件方案。随着阿里在芯片上的战略布局,他们也会在语音专用芯片上有更多进展。

4月20日,阿里全资收购大陆唯一的自主嵌入式CPU IP Core公司中天微,很多技术也是面向IoT领域。

“阿里IoT战略必须要做资源可控、技术可控、拥有核心竞争力的事情。”阿里巴巴CTO张建锋说,这也是达摩院组建以来最重要的研究突破方向之一。“达摩院”是阿里的一个全球研究院,目前已在全球多点设立科研机构,立足基础科学、颠覆性技术和应用技术研究。

    责任编辑:周正
    澎湃新闻报料:021-962866
    澎湃新闻,未经授权不得转载
    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈