下载客户端

视频｜李飞飞加盟谷歌后首秀：让数字世界里的“暗物质”发光

澎湃新闻记者王心馨实习生孙乐颖

2017-03-09 21:02

来源：澎湃新闻

谷歌视频API。实习生冯元晴来源：谷歌(01:16)

美国当地时间3月8日，原斯坦福大学人工智能实验室和计算机视觉实验室负责人李飞飞迎来了她加入谷歌后的首秀。在当天谷歌的“Next Cloud”17会议上，谷歌云计算人工智能和机器学习首席科学家李飞飞做了主题演讲，发布了谷歌云面向机器学习和人工智能的一系列新API（Application Programming Interface，应用程序编程接口）。这一新API能够通过深度学习识别视频内容。以往，视频内容是难以被识别的，被认为是数字世界中的“暗物质”。

在新产品发布中，这款名为智能视频API（Video Intelligence API）的技术让人眼前一亮。这项技术能自动识别视频中的物体，对视频内容进行分类，贴标签，从而让视频搜索变得更容易。

“实际上，视频中含有大量的数据，单单是YouTube，每分钟就会有好几百乃至上千小时的视频上传。要理解视频中这些丰富的内容，是计算机视觉中一个重要的、但一直以来都没有得到很好解决的问题。实际上，很多计算机视觉研究者，包括我在内，都将视频视为数字世界里的‘暗物质’。”李飞飞说。

在当天的展示中，谷歌播放了一个商业广告短片。这个API能够识别在视频里出现的腊肠狗，以及这只腊肠狗何时出现，随即还能识别这个视频是一个商业广告。

在另一个展示视频里，人们只需要简单地搜索“海滩”，这个API便能够搜索到含有海滩的视频，并附上时间戳。这种体验有点类似于谷歌照片搜索：当你在谷歌照片应用里搜索“日落”时，这个应用能够将你最美的几张日落时分的照片整合在一起。

之所以说这个应用让人惊叹，是因为到目前为止，多数类似的在云端提供的图像识别API都只专注于静态图像中的物体识别。而有了谷歌这个新API的帮助，开发者将能够开发出支持搜索和发现视频中信息的应用程序。

“作为一名计算机视觉研究者，我非常激动。这么多年来，我们终于开始理解‘暗物质’，并在这方面踏出了第一步。同时，也让我们的客户能够从嵌入在视频里的大量信息中提取价值。”李飞飞在演讲中说。

目前，这个新API正在内测中。它能利用深度学习模式，建立类似于TensorFlow的框架，应用于YouTube这样的媒体平台。

谷歌在很久之前就开始与一些全球最大的视频公司进行合作，帮助他们从无组织的数据（例如视频）中寻求价值。未来，这个API的服务对象是大型媒体组织、科技公司的消费者，此类群体希望能建立自己的媒体目录，或是用简单的方法来管理交叉信息的内容。另外，谷歌还打算与Cantemo合作，将API植入他们的视屏管理软件中。

谷歌称，随着这项技术的发布，谷歌云计算机器学习体系会得到扩容。目前这个体系已经拥有视觉、视频智能、演讲、自然语言、翻译等领域的机器学习方法。未来，谷歌希望还能提升机器学习的应用范围，让这些技术在医疗影像分析、防范诈骗等方面有更深入的应用。

校对：余承君

澎湃新闻报料：021-962866

澎湃新闻，未经授权不得转载

我要举报