澎湃Logo
下载客户端

登录

  • +1

谷歌让机器学会画简笔画,妈妈再也不用担心我手残了

澎湃新闻记者 王心馨 虞涵棋
2017-04-14 21:12
来源:澎湃新闻
能见度 >
字号

近日,谷歌开发了一款名为“AutoDraw”的应用,这款应用受到网友的追捧:它拯救了一些不会画画的人,还让低龄涂鸦画变成美术作品。

从上面的这个动图中可以看到,这款程序能从简单的几笔画像中识别特征,并给出一个更完美的简笔画。

谷歌的研究人员正训练自己的人工智能程序,希望它能像人类一样绘画和概括抽象概念。4月11日,谷歌大脑项目研究员David Ha和Douglas Eck发表了一篇名为《绘制简笔画的神经表征》(A Neural Representation of Sketch Drawings)的论文。

在这篇论文中,谷歌利用神经网络(RNN)训练了一个实验性的应用程序,可以协助艺术家创作以及帮助老师教学生绘画。那么这个程序究竟是如何做到的?

首先,大家需要了解什么是神经网络模型。在人工智能领域,神经网络最重要的用途是分类和识别。举例说明,把一张猫的照片交给计算机让其识别,计算机可以通过神经网络对这张照片的像素信息进行逐层分析,每一层都会有若干个神经元负责分解画面上的信息。

目前,科学家们利用神经网络,在训练图像识别和图像生成上已经有大量的实践经验。例如,谷歌的研究人员将图片输入搭建好的神经网络模型,让它识别该图片中的一个特征,而后修改图片以强调这项特征。接着,修改后的图像被反馈到神经网络,让神经网络再次识别其他特征并强调它们。但这样的训练方法有个限制:如果神经网络被要求识别更复杂的图像,例如识别一头动物,它就会产生一些令人不安的奇幻图景:3只或更多眼睛的猫和多只头的狗(如下图)。

在新的这篇论文中,谷歌的研究员对上述情况作了改进。“我们从原始数据中选了75个类型的数据来构建快速画画模型。每一个类型中都含有7万个训练样本,再加上额外的2.5万个验证和测试样本。”两位研究员在论文中写道。除了大量数据外,研究员还在系统中增加了噪音(编注:噪音的增加会导致模型复杂度提高,因为为了拟合所有的样本需要的多项式项数变多了。),以确保机器不会简单地重复真实的图片,而必须学习将图片的特征提取出来,表示为一个带噪声的特征向量。神经网络的解码器接收到它后,会产生一系列构建新图片的活动。

研究员以猫为例做了解释。当开发者们将一幅绘有三只眼的猫图片输入时,模型会生成一只只有两只眼睛的猫作为输出,这表明这一模型已经学习到猫类一般只有两只眼睛(如下图)。同时,为了证明这一模型不仅简单地从大量的猫类图片中记住了最接近正常外表的猫,开发者还尝试以完全不同于猫类的牙刷图片作为输入。最后,一个像猫、长有胡须、模仿了牙刷特征和朝向的图就生成了。

这表明网络已经学会将输入图片编码为一组抽象的猫类概念,嵌入到特征向量中,再基于该特征向量重建一个全新的图片。

“这个程序的关键在于研究了人们在画画时做了什么。比如朝哪个方向移动,什么时候起笔,什么时候停止绘画等。” David Ha说。他还强调,这个程序并不是在分析图片,而是进行了绘画创作。

    澎湃新闻报料:021-962866
    澎湃新闻,未经授权不得转载
    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈