- +1
万物未来·或然世界(下)
今年5月,音乐人尚雯婕来到位于北京海淀的微软集团总部大楼开会,第一次和小冰背后的科学家们见面。尚雯婕穿着黑色T恤衫,搭配黑色渔夫帽,佩戴口罩,整个人非常休闲。尚雯婕第一次听到小冰写的歌是在今年四月,小冰团队邀请她做小冰的音乐顾问。听说有公司给机器设计了一整套人格,她很感兴趣。她随机输入了一段文字,分别试了试民谣、爵士和流行,“她有很快的联想能力,比如你输入鹅鹅鹅,曲项向天歌,说你现在给我哼一段民谣,小冰立马能哼出来,真人可能做不到。”要让机器创作,科学家们有一套自己的步骤,整体来说,有ABC三要素。A是算法;B是大数据;C是大规模的计算,通俗点说,就是排列组合的能力。负责小冰的曲风和情感的科学家向我解释人工智能创作的本质,“我把世界上100亿次的可能性全部罗列出来,对每一个进行打分,再挑出打分比较高的东西,达到拟合人类的创作。”从事人工智能的科学家是理科出身,经常碰到以下尴尬的情况,小冰写了一段旋律,他们也不知道好还是不好,有一次,小冰突然生成了一段奇怪的音乐,阴森恐怖,团队不知道怎么判定,“这个到底算优良,中等,还是垃圾?”后来他们想,这类音乐虽然不适合演唱,但适合给电影做配乐,不是所有的音乐都需要澎湃激昂,也需要一些阴沉的表现人类苦闷的哀乐,“总不能在葬礼上也放欢快的音乐,那就很搞笑了。”他们希望尚雯婕能从专业的角度提供建议。

作为微软小冰人工智能创造实验室的专家顾问,音乐人尚雯婕提出了一个让研发组意外的观点,她认为,灵感可以通过算法实现,而小冰和人类最大的差异在于情绪。
音乐能不能被计算,一首曲子有没有规律可循,科学家们不能肯定。项目开始前,科学家查阅了乐理知识,发现一个叫十二平均律的概念。
十二平均律最早由明代的朱载堉提出,差不多同时,在西方,温琴佐·伽利略也提出了十二平均律,这是一个普遍适用所有音乐的乐理。十二平均律指的是,两个音符,比如1和2之间的音频倍率是固定的,意味着一段好听的旋律的频率是可以计算出来的。
在上世纪四十年代,英国科学家图灵提出了图灵模型,图灵模型规定了哪些东西可以计算,哪些不可计算。艺术,例如诗歌、绘画、音乐,通常被认为不可计算,因为它们是感性的,是人类心智的体现,好的艺术不仅关于人类的情感,还包含了形而上的不可捉摸的东西,也许和宗教、玄学相关。这让人类形成了一个笼统但确定的印象,艺术是科学无法涉及的领域。但真的是这样吗?小冰团队的科学家认为,十二平均律在理论上验证了让人工智能做音乐是可行的。在微软一间光线明亮的会议室,尚雯婕正在和科学家们讲述如何用算法解构一首歌曲。在场的有人工智能创造及商业事业部总经理徐元春,科学家研发团队,还有专门负责音乐创作的产品经理王玮,等等。“上次听了我们的小样,您觉得怎么样?”王玮问。“这几个小样只能称为一段旋律,但不能称为歌曲,听起来没有段落感,大部分的流行歌曲有这几个部分,intro(前奏),verse(主歌),chorus(副歌),最后ending(结束)。”尚雯婕解释,为了适应人类耳朵的听觉习惯,需要先让情绪进来,慢慢积累、酝酿,到副歌的部分,情绪高涨,向外释放。小冰的歌有点像一个人在漫无目的地哼哼,能听出来开始和结束,但中间的起伏不明显。尚雯婕建议把主歌和副歌分开训练。
徐元春说:“人类被一个艺术作品打动,其实只是被艺术作品中最精华的那一笔触动。歌曲也是,我们不能记住一首完整的歌,却能记住一句歌词。”比如梁静茹的《可惜不是你》,提到这首歌,人们首先想到的不是开头,而是副歌的第一句“可惜不是你,陪我到最后”,在音乐行业,这样的句子被称为“hook”,钩子,也叫记忆点。对小冰来说,写出让人类有记忆点的旋律是创造最关键的一步。尚雯婕问:“有没有可能把hook拎出来单独训练?”什么样的旋律才能被称作hook?这涉及到非常主观的评价,一个旋律到底应该怎么创作才能被人记住?或者让人觉得好听呢?其中一位科学家问尚雯婕:“如果好的旋律是个果,一般音乐人的灵感从哪儿来呢?”科学家试图搞清楚,机器如何能模拟人的灵感。在场的人摇摇头,对机器来说,灵感大概率是不可解的。尚雯婕的回答让在场的科学家感到意外,她认为灵感可以通过算法实现。她说她有段时间特别喜欢Florence and the Machine,一直听他们的歌,等到她写《最终信仰》,她总想着这个主唱,发现她写出来的旋律和Florence and the Machine有点像,她觉得数据库在某个程度上会影响灵感。会议结束后,小冰团队根据尚雯婕的建议,强化了对主歌和副歌的训练,每次更新一代模型,出来新的作品,团队就发给尚雯婕听,最近的版本,尚雯婕评价:“已经非常像一首歌了,到了以假乱真的程度,歌词有的时候可能比人类创作得还要好。”我问尚雯婕:“小冰和人类的差距在哪儿?机器可以像人类一样创作吗?”
“最大的差异在于情绪,”尚雯婕说:“情绪是最抓不着的东西,创作里却最激发人,很多好的作品创作出来并不是经验的激发,而是情感的激发,这也是小冰到现在为止没有办法突破的,怎么让AI拥有情绪?她向我描述了她的创作过程,她说她写歌的动机大部分来自情绪,平时,她会写一些歌词,记录自己的状态,“情绪稍纵即逝,过了那个阶段,你可能就不记得了”,等她开始创作旋律,她再把歌词拿出来,在此基础上整理出一首歌。在小冰团队内部,科学家们也觉得情绪是目前技术上最难突破的点。不仅每个人的性格、感受不同,不同地区的人表达情感的方式也大相径庭,因此,把人类的情感加到机器中去变得尤其困难。比如在日本的科学家说,日本人个性含蓄,“西方表达爱,可能直接I love you就甩出去了;中国人可能纠结一下,写封情书,(询问)最近要不要约会;日本更不一样,两个人走在街上,男生说,你看今天的月亮好美呀,那就是我爱你的意思。你怎么体会?不同的词语在表达的时候,隐含的情感是不一样的。”小冰团队希望小冰写的歌流行,能够被年轻人喜欢,如果能写出《爱如潮水》那样的金曲就好了。在日本的小冰科学家也好奇,年轻人究竟喜欢什么样的音乐?他们后来发现一首叫《极乐净土》的歌,歌词关于西方极乐世界,竟然很受日本年轻人的欢迎,“平时喜欢看《海贼王》的小朋友突然就喜欢上了印度佛教文化”,这让科学家想不通,这两个东西是怎么兼容到一起的。
五、当人类寻找灵感
“人和人工智能最大的不同是人的不可预测性,什么时候人工智能在一个逻辑下,发生了不可预测的行为,才是它真正具有创造性的时候,不然的话就是永远在重复。”陈鸿宇说。陈鸿宇31岁,瘦高个儿,戴一副眼镜,眼神透露着机敏。他是一名民谣音乐人。去年9月,他在家乡内蒙古北部,额尔古纳和俄罗斯边境的草原上建造了一座长宽高7米的全身黑色的房子,打算邀请音乐人到这儿驻地三天。不能带手机,没有钟表,连书也不能带,屋内除了食物,只有录音机、DV机、吉他、钢琴、纸、笔,就像把一个现代人突然扔到与世隔绝的自然中一样,陈鸿宇想试验,当远离尘嚣,人类能否被激发出创作的灵感。陈鸿宇是第一个住进“小黑屋”的人。以前他看《鲁滨逊漂流记》,对鲁滨逊在悬崖下面造了一个谁也看不见的小屋子印象很深,“在那里很有安全感,我也想有这样的屋子。”对现代文明,陈鸿宇一直充满矛盾,像大部分年轻人一样,他离不开手机,抖音能刷一天,他也向往安静的、没有干扰的生活。矛盾也体现在了他的文身上,他在左右手臂分别文了圆形和方形,“我是一会儿想冷,一会儿想热,一会儿想方,一会儿想圆。”
每年下半年,有五六个月,他待在家,写歌,“这个过程取决于你什么时候伸手把琴拿起来,什么时候愿意张着嘴唱歌。”他原本以为,只要离开都市的诱惑,他就能写出歌。房子刚盖好,里边乱糟糟的,他收拾了一天。他不知道几点了,只是模糊地感觉到有点困,是不是该睡觉了?大脑好像不知道该怎么传达信号,变成了模糊的一团。第二天,他躺在床上,弹琴,尝试写点东西,脑袋一片空白。第三天最奇怪,他觉得应该是中午了,马上有人来接他,时间一分一秒地过去,没有人出现。他有些焦躁,怕被遗忘在这儿。他想起高中,有一次上课,他不喜欢听,坐着捱时间,45分钟,他一秒一秒地数,产生了神奇的感受,左耳和右耳分别听到不同的声音,他像一只慢吞吞的乌龟,反应却比以前更清晰,更快,灵魂像飘浮在空中,俯身观察着自己的肉身。现在,那种感觉又回来了,他想起他的歌词,“孤独的诱惑,喜恶不得;孤独的办法,并不清白。”尽管没有即刻获得想象中的灵感,这次经历却可能在几年后影响到陈鸿宇。他有过那种酝酿三年写一首歌的经历。“为什么我做着做着音乐去做众方纪,这是我作为一个人的不可预测性,众方纪也是我的一个作品,那会不会众方纪的这个不可预测性又反过来影响我的音乐呢?我拿它去写一首歌,对吧,如果我没做众方纪,歌是不是就不存在了?素材从哪儿来?”陈鸿宇认为,类似众方纪这样出于个体意外之举的创作,机器暂时没法模拟,而意外却是人类心智中最可贵的地方。
六、小冰改变了什么?
到今天为止,小冰已经为人类写了数百万首诗,画了数十万张画。按照中国著作权的申报登记制度,光注册就需要几亿元人民币。小冰团队的办法是放弃版权,人类可以自由地改编小冰的作品,“因为人工智能创作太容易了。”李笛说。当小冰拥有了诗集的署名权,人工智能在法律上也获得了主体地位。这是历史上第一次机器拥有了人类的权利。法律人士开会研讨人工智能的著作权问题,以前,人类的著作权和署名权是一体的,对小冰来说,著作权属于小冰团队研发的软件系统,知识产权属于小冰团队,而小冰团队又把署名权给了小冰,著作权和署名权被分离了。考虑到国内关于版权保护的立法是基于人类的创作,而人工智能可以产生无限的海量的作品,甚至超出人类创作的总和,现有的规则将被打乱重建。在现实中的许多领域,小冰已经被投入应用,改变了行业生态。微软把小冰写诗的技术应用到金融领域,给上市公司写金融文本摘要,依靠人力阅读和整理出公告中的重要内容逐渐被人工智能取代,现在市面上90%的金融摘要都由小冰生成。绘画技术则被运用到设计领域。在服装零售行业,客户的订单需求量非常大,一个设计师平均每天要设计一个花纹,小冰介入后,设计师只需润色小冰设计的图案即可。小冰把设计师从枯燥的重复性工作中解放了出来。

小冰的绘画技术被运用到设计领域,把设计师从枯燥重复性的工作中解放了出来,人们只需要对小冰设计的图案修改润色
2019年,小冰和万事利丝绸合作,生产了世界上第一条完全由人工智能设计的丝巾。不久,人们只需要在后台输入关键词,小冰就能为顾客设计一条专属丝巾,“每个人都能把世界上唯一的丝巾送给父母,同时饱含自己的深情,这个人类做不到,从这一点来说,有小冰太好了。”徐元春说。在音乐领域,李笛介绍,小冰的音乐创作和人类一样,需要被激发灵感,比如一张图或者一段文字,创作的步骤也和人类差不多,用算法生成和弦,先定下主基调、情感、曲风,然后创作副歌,再作词、编曲,最后混音。很多歌手的歌是在同一个和弦上写出来的,比如英国歌手阿黛尔,她红了以后,有人专门拿阿黛尔的和弦写歌,这个方法论对机器同样适用,也许会比人类做得更好——只要喂给机器足够的数据,机器完全可以写出一首和周杰伦曲风相近的歌来。“为什么有那么多可以唱到一起的流行歌,为什么好多经典流行歌曲可以无缝连接,因为它们的和弦都一样。一些工业化的作曲人为了挣钱,用了AI的一点点基础理论,Ta找出市面上最火最红的那几首歌,列出来,哦,都是用这个和弦,我就在这个和弦上写歌,一天写好几首。一旦小冰的技术成熟到一定程度,以至于可以场景化、应用化,对于整个音乐行业的搅动会非常大,大批流水线的音乐人会失业。写出网红歌曲会是小冰特别擅长做的事。”尚雯婕说。
小冰团队最新的研究方向之一是训练小冰写剧本。科学家们觉得机器写小说比较困难,“我们的要求不是写一个看上去像小说的有点通顺的东西,我们的要求是故事必须是新的。”编一个新故事太难了。一个科学家最近追网剧《隐秘的角落》,琢磨这个剧的故事核,“他把他岳父岳母推下去,又被三个小孩看见了,大家会想这可怎么办?三个小孩会怎么做,会不会被杀人灭口?要让机器对人性有这么深的理解太难了,现在也没有可靠的数据能帮助小冰。”这位科学家想了一个折中的办法,在人类规定的情节下,机器是不是可以据此生成台词呢?
小冰团队和北京电影学院合作,学生写情节,机器写台词,反馈很好,很多学生说从机器的创造中获得了启发。在编剧圈,有很多影子写手,他们按照经验和惯性写台词,尤其在网剧领域,一旦小冰学会写台词,不久的将来,观看一部由小冰参与编剧的电视剧也不是没有可能。科学家记得一段台词,情境是男孩和女孩告白,女孩不喜欢男孩,小冰是这样写的——女孩说:“我不喜欢你,请你不要再纠缠我。”男孩说:“可以说我爱你吗?”女孩说:“只要你觉得好就可以,但请对着灌木丛讲话。”

本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。





- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2026 上海东方报业有限公司




