澎湃Logo
下载客户端

登录

  • +1

思想人工智能 | 机器诗人的诗,你真能认出来?

2018-12-12 11:45
来源:澎湃新闻·澎湃号·湃客
字号

编者按:人工智能已经进军文学艺术领域,机器人不但能命题作诗,还能看图作诗,其作品也不像一般人想象的那样具有明显的“机器味”,一眼就能辨别,而是与人类的创作在形式上有了很强的相似性,具有了一定的迷惑性。机器创作的过程是怎样的、其背后的原理是什么,对艺术创作是否有促进作用,将来又是否会超越人类的水平,本文将一一揭示。

“小冰”作品的诗意哪里来?

“诗言志,歌咏言,声依咏,律和声。”中国文化对诗歌的这一经典定义出自《尚书·尧典》。发心声以文字,即为诗;谐声合律,歌之以咏志。究其文学意义,诗是集哲学的抽象、艺术的美丽于一体的最高文字表达形式,也是人类存在的最高形式之一。

现在机器人“小冰”出版了自己的“诗集”,看来高雅如赋诗从此也被机器接管了,诗歌爱好者只需将“假凤虚凰”信手拈来,把玩吟诵,不亦乐乎,何须搜索枯肠、必欲“语不惊人死不休”?

不过,空发感慨,易;守住人类最后禁地,难。

展望未来,智能机器到底是停留在玩“拼字游戏”阶段,无法在“言志”上跟人类一比高下,还是拿下这个智能高地,同人类彼此唱和,尚难断言。

一、 诗歌何以人文?

信息时代,技术的发达让各种信息渗透个人和公共生活的方方面面且无休无止,既大大方便了人际交流,也让交流空前浅薄化、碎片化和庸俗化。每天汹涌而来的流量,像浪涛拍碎在沙滩上,连水渍都没有留下,就被后来的信息湮没了。不要说千年流传,明天还能记得的短信微信,又有几许?这真是一个文字太多而作品太少、作品太多而流传太少、流传太多而经典太少的时代。令人恍恍然有隔世之感的是,当下竟然仍有一些学者坚守文人的情怀、意趣和兴致,唱出了技术垄断下人的存在感,在面对面的交流、雅集、诗词唱和、书画往还中,不知今夕何夕。

2009年,上海昆曲研习社一众诗友,追慕古人风华,去往黄山雅集唱曲,隔着千年漫漫风烟,致敬前贤,抒发当下。如此盛景尽收于一阕《金缕曲》: 明末,弘仁、江注唱于黄山,琴箫合奏,仙猿闻之以啼鸣。四百年间一瞬耳。去岁孟秋,共沪上昆曲研习社,往黄山唱曲。过午,抵山麓之猴谷。黄昏时分,潺潺溪水边,乃曲会开锣。入夜,余兴未了,遂挑灯于曙光亭上。是时也,群笛呼应,曲唱不歇,星月同辉,山山可数。

哪处曾相见?遍黄山,重循旧径,又闻莺燕。一霎仙猿啼啸处,曲社鸣锣开宴。更合取,溪声溅溅。多少鸿泥成往迹,共座中一曲桃花扇。歌未罢,暮云变。

云间不似寻常院。且留连,曙光亭外,雨丝风片。谁慰飘零谁人和,擫笛弹词千转。曲杂奏,松涛幽咽。亭会歌吹浓于酒,忽醉时山谷星如霰。端正好,漫磨研。这岂止是雅集,更是文化传承、生活方式、审美趣味乃至人生信仰!

这边厢,诗人吟唱犹在耳畔,那边厢,会作诗的机器人已叫板门前,风和日丽转眼阴云密布,绿肥红瘦翻作雨打残荷,古体诗歌是否已来到万劫不复的悬崖边缘?

二、 机器诗人真的技胜一筹?

柯洁被AlphaGo完胜之际,泪洒棋枰,媒体评论为“哭得像被压在五指山下的齐天大圣”。机器以60连胜横扫中日韩顶尖高手,有音乐人发微博说:“为所有的大国手伤心,路已经走完了……荣誉信仰灰飞烟灭。”更悲哀的是,“等有一天,机器做出了所有的音乐与诗歌,我们的路也会走完”。

一语成谶。

没多久,“中国之声”推出《“进击”的AI》系列报道,说人工智能不仅会下围棋,还写起诗来,竟然出了诗集。

自尊的人们依旧相信人工智能写的诗词必定语无伦次、不堪一读。果真如此?这里,读者不妨自己比对和判别一下,哪首是机器作的,哪首是人写的。

《春雪》: 飞花轻洒雪欺红,雨后春风细柳工。一夜东君无限恨,不知何处觅青松。

《雪峰》: 白云生出起高峰,鬼斧神工造化功。古往今来谁可上,九重宫阙握权衡。

有人猜《雪峰》是人工智能写的,因为里面有一个熟词“鬼斧神工”,通常诗人不会直接把被用烂的成语或熟语搬入诗中,只有人工智能光会组词,不懂规矩,才敢公然入诗。也有人认为《春雪》应该是人写的,因为“雪欺红”颇有意境,以机器的智能水平,很难有此神来之笔。

答案出乎意料,机器完胜。

第一首《春雪》是机器写的,第二首《雪峰》是人写的。当然,写这诗的人也不是一流高手,将“鬼斧神工”直接搬入诗中,属于“低级错误”,还多半不是偷懒所致。

世无英雄,遂使“机器”成谋!

其实,《春雪》在时序、逻辑、特别是大感觉上都有不对的地方,“东君”指的是太阳,“一夜东君”本身就不通得很。所以,机器写的诗一眼看上去像诗,却经不起推敲,缺乏诗的内在情感和逻辑。

一组不说明问题,那再来一组。

《悲秋》: 幽径重寻黯碧苔,倚扉犹似待君来。此生永失天台路,老凤秋梧各自哀。

《落花》: 红湿胭艳逐零蓬,一片春风细雨濛。燕子不知无处去,东流犹有杜鹃声。

有人认为,《悲秋》应该是人写的,因为感情和逻辑上比较连贯。确实,第一首在时序和逻辑上比较到位,而第二首的部分语句比如“东流犹有杜鹃声”,组合牵强拗口。“诗无达诂”,诗词固然不求甚解,但挑剔文字的人对细微之处的违拗,还会有骨鲠在喉的感觉。

第三组难度大了,这是两首同名的《秋夕湖上》,机器经过不断学习,突飞猛进,人写的这首却不甚突出。

《秋夕湖上》: 一夜秋凉雨湿衣,西窗独坐对夕晖。湖波荡漾千山色,山鸟徘徊万籁微。

《秋夕湖上》: 荻花风里桂花浮,恨竹生云翠欲流。谁拂半湖新镜面,飞来烟雨暮天愁。

显然,第一首应该是机器写的,“一夜秋凉雨湿衣”,说的是一夜过完了,后面又讲“西窗独坐对夕晖”,时间上有冲突。除此之外,其他的还说得过去,比现如今一本正经的“打油诗”好多了。

总的来说,智能机器人的佳作虽然跟一些三流诗人的作品已不分伯仲,但往往靠偶然得之,放到一流诗词高手面前,撇开逻辑不说,在意境、情感上仍然相去甚远。

其实,机器写诗并非始于今日。

早在20世纪70年代,有好事者弄了个高频诗歌词语转盘,形同轮盘赌,转到哪个词就记录下来,连起来生成一首“诗”,名之为“word salad”——把各种词语像沙拉一样拌在一起。

进入21世纪,有了人工智能后,机器写诗增加了内在合理性,才能以假乱真以至于是。几年前,旧诗圈里诞生了一款颇有战斗力的作诗机(稻香居网络作诗机5.00)。方家经反复比对,得出一个结论: 机器擅长写工整的七律,而用于内在要求更高的五律,则显得凑合,至于七绝、五绝、词等,就不堪卒读了。偶尔这机器也能写出吸引眼球的句子,比如:“高低峭壁临空尽,宽窄长河向地悬。”状景熨帖,气象宏大,虽然依旧有些拗口,但确有新意在。

一位朋友见之,诗兴大发,将其扩充完整,每一句都不输此对句,且对仗应用都很好,全诗气贯神连,真似同机器较上了劲: 梦我醉眠乎九天,逡巡歌哭以穷年。高低峭壁临空尽,宽窄长河向地悬。眼底营营真聚蚁,云间寂寂可求仙?茫然欲语成悲感,风里飘摇一纸鸢。

三、 “小冰”诗作有何高妙?

由微软公司发明的机器人“小冰”,通过对1920年后519位现代诗人的上千首诗,经过10000次迭代学习,练就了写作能力。“小冰”每次学习时间大约是0.6分钟,10000次仅需要100个小时,至今创作了70928首诗,从中被精心挑选出139首,结集出版,谓之《阳光失了玻璃窗》。为了给“小冰”的作品申请书号,还惊动国家新闻出版广电总局的高层,因为机器人写诗出版多少涉及伦理和法律问题。

“小冰”学习的都是现当代最经典、最有代表性的诗人和诗作,包括林徽因、徐志摩、余光中、顾城、北岛等,经过反复训练,已然形成“独特的风格、偏好和行文技巧”。“小冰”的学习特征在作品中有鲜明流露,哪个阶段学习哪个人多一点,就会偏向这个诗人的风格多一些。“小冰”的“作诗生涯”始于2016年,正式发布前,曾多次暗中试水,还以真人身份投稿,从2017年2月开始在天涯、豆瓣、贴吧和简书上用27个化名发表作品。“小冰”也曾向杂志社和报社“投稿”,并收到刊发的邀请。

“小冰”写的现代诗是这样的,比如《生命的颜色》: 你双颊上的道理/是人们的爱情/撒向天空的一个星/变幻出生命的颜色/我跟着人们跳跃的心/太阳也不必再为我迟疑/记录着生命的凭证/像飞在天空没有羁绊的云。看起来满眼是诗,却经不起简单推敲。比如“你双颊上的道理”就是臆造的句子。但现代诗往往本身即为零碎蔬果的拼盘组合,越是“语无伦次”,读者越会觉得拽、牛,要的就是跟你平时接触的文字组合和语序句式的不一。然而,奇则奇矣,巧则巧矣,根基甚为不稳,一触即倒。这犹如奥运会和吉尼斯的区别,前者拼的是实力和技艺,后者只有奇巧和搞怪,虽然不乏创意,毕竟少了灵气,多了取巧,人类的志向也单薄了不止一点两点。“小冰”的诗词每一句都比较跳跃,有奇巧的语境,但浑然不知所云,没有内在逻辑,诗中所说的“像飞在天空没有羁绊的云”,似乎正可视为小冰诗作缺乏逻辑的写照!

再如“小冰”在《尘埃》中写的“五分了艺术纵通,一去不返于古代人”,完全不通。“曾经在这世界,我有美的意义”,这句话很不错,天空中没有留下“我”的痕迹,但“我”曾经飞过。就像苏东坡所说:“(吾)画不能皆好,醉后画得,一二十纸中,时有一纸可观。”东坡自谦,说自己好的画都是靠碰得的。“小冰”的诗词中,也常有靠碰得但确实惊为天人的零散佳句。

“小冰”还能够根据提供的图片即兴作诗,其最擅长对风景照片的描绘,天空、花朵、楼宇……都能被当作创作的意象,组合成完整的诗句。偶尔跳出“眺望我们的爱情,我要让你看不见”这种有意味的句子。

诗人“小冰”火了,并不意味着小冰们拥有了类似于人类一样独立的“情感”,实际上只是模仿人类使用语言的表达规则,来拼凑抒情的诗词。《红楼梦》中写到勤勉的香菱向林黛玉学诗,黛玉传授了一些简单的诗歌写作方法,“小冰”学诗也类似,尚处在蹒跚学步阶段,靠概率出现意象自然拼贴的佳句,但基本没有逻辑鲜明、情感连贯的精彩篇章。

诗词本身诉诸人类的联想,因此给了意象拼贴以较大的想象空间,即便毫无关联的两句话放在一起,读者也会把自己的经验和情感投射进去,从而“读出”其中的诗感,意兴盎然。西语曰:“有一千个读者就有一千个哈姆雷特。”这里重要的不是哈姆雷特,而是读哈姆雷特的读者。

但是毕竟在人工智能的技术下,机器对于词句组织的学习有了突飞猛进的发展,往往可以自然构成意境,呈现出逻辑通顺、组词灵动、意象奇特的外部特征,开始展示出一定的艺术风采。相比那些只知道使用“回车键”的诗人,还胜了一筹。

现在的问题是,未来又会如何?机器智能能再上一层楼吗?

四、 机器诗人如何创作?

研究人文学科的人,对机器智能最不屑的一点是:“你可以重复人的劳动,但你会创作吗?”确实,机器写出来的诗,很冰。“小冰”这个名字起得挺好,或许没有情感的温度,但确有自己的洁白美丽。

古人说的“诗言志,歌咏言,声依咏,律和声”,用现代人工智能语言来说,正合于诗歌生成模型的三个组成部分: 言模型,即语言的语义模型,写诗不能词不达意;歌模型,即词句的艺术模型,写诗要用诗的语言,要有抽象的形式美和形象化的意境;律模型,即诗歌的音律格式。律模型是规矩,不用学习,作为规则,让机器遵守就是。这就是为什么机器写的诗,韵律都很好。言模型是自然语言理解技术发展的直接产物,而歌模型则得益于深度神经网络技术的成熟。

在哲学思维向度上,科学有英美经验主义和欧陆理性主义之分。英国人的经验主义思想在近代科学的发展中居于主流地位,这在大数据时代尤为突出。前面提到的贝叶斯理论正是源自经验主义的统计学逻辑。经验主义和理性主义的学派之分在自然语言处理中同样壁垒分明。

在自然语言处理中有基于理性主义的语言学派和基于经验主义的统计学派。麻省理工学院的乔姆斯基(Chomsky)提出了计算语言学,因此成为语言学派的开山鼻祖。乔姆斯基认为,理论先于事实。语言是结构化的,语言的结构是内在的,而不是通过经验习得的。语言的可能性是无限的,统计不可能解决问题。乔姆斯基对统计方法的排斥,恰似波普尔对归纳法的批判。

在乔姆斯基看来,人对语言的创造性使用能力是人性的标志。乔姆斯基认为机器是被迫行动,而人则是主动行动或煽动,语言是心灵的镜子,诗是人对语言的创造性使用能力的体现。既然诗歌体现了人类高级智能,那么通过让机器赋诗作词,来检验图灵测试,验证人工智能,就是完全合理的了。不过,由于计算语言学醉心于语言结构的研究,在语言模型上偏重于文法,所以,生成的诗词乏善可陈。毕竟,用如此简单的语言模型就想生成好的作品,实在有点过于小看诗歌了。

出现于20世纪70年代的早期诗歌生成模型,即所谓“词语沙拉”,只是简单地将词语进行随机组合和堆砌,并没有考虑语义语法要求,最后得到的多半是诸如“苹果吃姑娘,残红杀马特”的戏谑效果。用来恶作剧可以,但诗人不会视之为“创作”,科学家更不会认可里面有“智能”。

而后,人们发展出基于模板和模式的方法。这个方法类似于完形填空,将一首现有诗歌挖去一些词,作为模板,再找些其他词进行替换,产生新的诗歌。这种方法生成的诗歌在语法上有所提升,但是灵活性太差。因此后来出现了基于特定诗歌模式的言模型,通过对每个位置中词的词性加以规定后,再引入律模型,对韵律平仄进行限制,由此生产新的诗歌。

这里拿李白的五言绝句做例子。先把五言绝句拆开,套入设计好的平仄模型,然后从李白习用的词库中随机选择字词,组合起来就有了。这形同把李白的五言绝句,打散成乐高积木,重新组合,生成有平仄特征的新诗。比如,“羞玉未曾看”,被打散成“羞玉”和“未曾看”;“燕然水月牵”也被同样分成两个词组。因为五言绝句有平仄格律,所有诗句都被打散后,仄仄、仄仄平平、平平这样的格律模式自然呈现出来。

一切准备好之后,根据模板,给个随机数,就可以生成对应的五言绝句。比如选取某人生日,按照年月日的数字,分别在不同列的对应行中找出词语,最后生成这样的五言绝句: 羞玉竟不还,西湖哀苦寒,凤楼留不住,夜郎醉不眠。如果换个人,也用他的生日做索引,可以生成另一首诗: 羞玉贵乡还,江南觉夜寒。凤楼都莫问,夜郎齿开难。两相比较,第二首明显暧昧不少: 寒夜去凤楼,所为何来?既然不让人问,自己当然更不会主动讲,所以“齿开难”。如此诗作是否逻辑性和连贯性都好多了?

这些方法都是基于计算语言学的思想,没有太多的学习。后来,人们在这些工作的基础上加以改进,开发出“遗传算法”。所谓“遗传算法”实际上是一种全局优化算法: 设定一个评估函数,对搜索的结果,不断评估,不断修改,反复迭代,直到取得预先设定的满意结果。

在人工智能技术范围内,诗歌生成可以看作一个搜索问题。先从随机诗句开始,然后借助人工定义的诗句评估函数,对生产的诗句做出评估,而后按一定的进化规则作词的置换,再作进一步评估,不行的话,再置换,反复迭代,一直到最后生成的诗句满足要求,迭代方才停止。这个算法的优点是能取得较好的结果,只是缺乏语意连贯性这个问题还无法解决。比如,写一首词,爱好文学的人都知道,词比诗难写,就可以基于遗传算法来生成。整个“创作”过程大体如此:

先确定关键词: 主题——菊,词牌——清平乐,风格——婉约。

然后输入一首《清平乐》词,借助人工定义的诗句评估函数不断给出评估,进行迭代,最终得到的词:

相逢缥缈,窗外又拂晓。

长忆清弦弄浅笑,只恨人间花少。

黄菊不待清尊,相思飘落无痕。

风雨重阳又过,登高多少黄昏。

懂诗词的读者会发现,词中几乎每一句的感觉都对,但是合在一起,味道便不对了,逻辑联系和语意连贯上都有问题。要用来装个“文艺范”,忽悠人,还是能办到的,但要碰上懂行的人,就露馅了。

如果把生成条件改为: 主题——佳人,词牌——点绛唇,风格——婉约。

再把上面的词输入,通过计算机进化迭代,最终就会得到一首《点绛唇》: 人静风清,兰心蕙性盼如许。夜寒疏雨,临水闻娇语。佳人多情,千里独回首。别离后,泪痕衣袖,惜梦回依旧。年轻人用这首词来约会,不定能“一击而中”。

自然语言处理的技术突破发生在1988年,在那年举办的计算语言学会议上,IBM的TJ Watson研究中心机器翻译小组发表了关于统计机器翻译的论文,并推出法语/英语的翻译系统Candide,这标志着大数据时代统计学派的兴起。统计学派的一员主将就是这个小组的核心人物贾里尼克(Jelinek),作为一名信息论专家,他的名句是:“我每开除一名语言学家,我的语音识别系统的性能就提高一点。”

在后来的几年里,统计学派大获成功。2016年,Google发布的神经机器翻译GNMT(Google Neural Machine Translation)系统再次大幅提高了机器翻译的水平。Google使用了循环神经网络RNN(Recurrent Neural Network),以句子为基本单位,一个句子就是一个系列,进行序列到序列(Sequence to Sequence)的学习。这个基于深度神经网络的翻译技术相比Google早期基于短语的翻译系统,误差降低了60%,翻译质量获得巨大提升。2017年,Facebook进一步提高了翻译效率。他们采用卷积神经网络CNN(Convolutional Neural Network),进行序列到序列的学习。Facebook声称,英文—德文和英文—法文翻译的基准测试表明,他们的结果在准确度上不输于Google。

统计方法的一个特点是不需要语言学知识,也就是说不需要懂源语言或目标语言,就可从事机器翻译。对一个机器翻译器而言,究其根本,翻译并不是理解的问题,翻译本身不需要解释,翻译只是找到源语言与目标语言之间在统计上有意义的对应关系,而这同语义无关。这个观点对诗歌的生成同样适用。也就是说,诗歌生成可以看作一个机器翻译问题,将上一句看成源语言,下一句看成目标语言,用统计机器翻译模型进行翻译,并加上平仄押韵等约束,得到下一句。通过不断重复这个过程,就可以得到一首完整的诗歌。只要让机器学的诗足够多,最后生成的诗在质量上应该是很不错的。

以词句为基本单位的机器学习所对应的不是言模型,而是歌模型。在言模型上生成的诗歌非常依赖于诗词领域的专业知识,需要专家设计大量的人工规则,对生成诗词的格律和质量进行约束。所以,一般都用于生成格律诗。对于像“小冰”那样创作现代自由诗,我们就必须用以词句为基本单位来学习的歌模型。

歌模型需要用深度神经网络,如循环神经网络RNN来表达。在训练时,诗歌的整体内容被作为训练语料送给RNN语言模型进行训练。训练完成后,先给定一些初始的诗句,然后按照语言模型输出的概率分布进行采样得到下一句诗句,不断重复这个过程就产生完整的诗歌。这是“小冰”这样的机器诗人的基本构造。

歌模型也存在一些明显的问题。例如,用户的写作意图基本上只反映在初始提供的诗句中,所以,前面生成的诗句尚能达意,随着生成过程持续进行,后面句子和用户写作意图的关系越来越弱,随之可能出现“主题漂移”,即所谓词不达意。所以,需要采用各种方法来加以改进。例如,可以提供场景信息。下面说到的“看图写诗”就是一个很好的办法,图就代表重要的场景信息,也可以参照人类写诗反复修改的过程,加入打磨机制,通过反复迭代来提高诗歌生成质量。

一般说来,对于这些有规则的知识,机器掌握得肯定比人快、比人好。机器不如人的地方,一是没有情感,二是连贯性不够好。所以科学家继续努力,试图通过让机器学习更多的好诗,来解决连贯性问题。不过一味以逻辑连贯性或语意清晰度来衡量诗词优劣,也容易出错。古诗词中不讲逻辑甚至不知所云的佳句着实不少,比如李商隐的名作《锦瑟》中有“沧海月明珠有泪,蓝田日暖玉生烟”之佳句,后世方家几乎无不叫绝,却从来没有人搞清楚过,这两句诗到底讲什么,不定只是诗人忽生灵感,觅得佳句,不忍舍弃,姑且用在了此处,也未可知。

五、 机器诗人如何看图作诗?

机器不仅会根据命题作诗,颇有古人唱和的范儿,还会根据图片生成诗作。其中的原理和逻辑跟直接作诗又有不同。

看图作诗需要用到两个模型: 第一个是规划模型,将代表用户写作意图的图像作为输入,机器在理解图像的基础上,生成一个写作大纲,即由主题词组成的句子序列。每一句有一个主题,相当于每一段的“中心思想”,第i个主题词就代表第i句的主题。机器看图作诗,关键就在于从图像而得出这个大纲。

第二个是生成模型,也就是一个基于编码器(encoder)和解码器(decoder)组合的框架。这种模型最早见之于机器翻译,用于看图作诗时,生成模型需要有所调整,配置两个编码器,其中一个编码器将主题词作为输入,另外一个编码器将历史生成的句子拼接在一起作为输入。换言之,第一个编码器用来解决有待生成的诗句讲什么的问题,而第二个编码器解决的则是所谓“上下文”关系,就是把上一句讲什么告诉下一句。经过两个编码器输入后,由解码器生成下一句话,通过注意力(attention)机制,把每句的中心思想,运用机器翻译的方法找到对应的字词,嵌入诗中,一句连一句,最后生成一首诗或词。

看图作诗的操作过程大致为: 对着一朵花,先拍一张照片,让机器进行模式识别,识别出里面是花,花就成了主题。然后生成一首诗。

如果机器仅仅认识了花,生成的诗会比较烂: 雨引鸟声过路上,日移花影到窗边,赖有公园夏风地,欣喜玩沙遍河山。机器作诗,真叫不知所云。这就是根据历史学习得到的逻辑而生成的诗作,照顾到了上一句是什么、下一句是什么,其他暂时顾不上。

如果机器从图中得到了进一步的场景知识: 景物——花,天气——晴,心情——愉悦,便会生成另一首诗: 当午新晴照花光,青霞琉瓶群芳香,窗外闲居添自在,灯前相逐影伴塘。两相比较,第二首明显比第一首好不少,因为图产生了一个比较完整的场景作为写作大纲。

机器“创作”的诗词同人类作品相比,总还有不小的差距,因为创作诗词是一个复杂的过程,但机器正通过模拟出人类创作的各个环节而逐步逼近。现在最大的问题不是机器模拟人类的仿真度是否达标,而是仅靠模拟,机器能传递出人类创作的真谛吗?“诗言志”,机器也能有自己的“志”,并吟唱出来吗?

六、 机器诗人真能创作?

诗词好坏有内在的标准,格律、句式等形式化元素之外,还在于作者的真情流露且表达既别出心裁、又恰如其分,更困难的地方还在于“诗言志”。从心理学角度说,意志与情感不易分开,“书以道事,诗以达意”,这才是关乎诗词格调高下的关键所在。而恰恰在这一点上,诗人和机器大相径庭。

上海大学美术学院胡建君老师曾用三到四周的时间,训练大学生掌握简单的格律,练习填写绝句、律诗、小令和长调。短暂训练之后,学生学会了欣赏优秀的诗词作品,还能够以真情实感写诗作词,基本符合起承转合的变化要求,表现出较为清晰的逻辑性和时序性。有位零基础的女生,经过短短四周的学习,写出了平生第一首词,词牌名是“满庭芳”,主题是“蔷薇”: 古木新抽,晚樱飞尽。(点明蔷薇花开放的时间。)碧水闲睡鸳鸯。(点明蔷薇花开放的环境,在美丽的鸳鸯湖边。)晓风微冷,吹十里花香。

曲径通幽巷里,寻觅处,白雪依墙。(这几句有个寻觅的动态,更点明确切的地点。寻香而去,在曲径通幽处,发现白蔷薇。)

垂条乱,弱枝生刺,不肯就罗裳。(写出蔷薇不仅香、美,而且有其内在的个性,柔中带刺。)风扬,疏雨过,红颜水洗,

尤胜新妆。(这里有一个转折,经风吹雨打之后,花儿更加清新高雅了。)暗香袭人来,如醉千觞。自古芳华易逝,却无奈,花落秋凉。(此处又有一个情绪的变化,怕持续的风雨会将鲜花催尽,如青春易逝。)何须叹,来年五月,恰又满庭芳。(最后笔锋一转,给出一个昂扬的结尾: 虽然今年鲜花已落败,明年不是照样粲然开放吗?)这首词不但句式、格律像模像样,而且时空变换合理,情感丰满,意境开阔,志趣高远,有着起承转合的内在变化和逻辑脉络。学生的聪慧引出老师感慨: 机器再善于学习,也做不到这一切。

这样的感慨既有道理,也没有道理。

一方面,机器虽然偶尔会有一些精彩句子的编排,但不可能有这样连贯的内在情绪之回环转折,毕竟机器没有人生经验和生死感慨。对它来说,生命的过程,所谓生老病死,最多只是部分零件的损坏,而且还需要一个前提,就是机器能意识到自己的存在。

另一方面,如果以起承转合、情绪、志趣生发为衡量诗歌优劣的标准,今天的机器已经完全能够做到。只要给机器设置一个节奏,明确这部分的风格是忧伤,作为意境贯穿进去,忧伤之后是喜悦部分,同样贯穿进去,喜悦完了又忧伤,忧伤完了再喜悦,如此等等。机器把情绪表现得足够“跌宕起伏”,是完全不成问题的。

今天,人工智能已经发展到,凡是可以量化的场合包括带有模糊特性的图像识别,机器都有能力进入,并且做得比人好。在诗歌这个特定领域中,比较机器作品与人类作品在格律、句式、用词乃至起承转合等方面的异同,已经没有多大意义。真正显露两者不同的地方是情感的连贯性,而不是逻辑的连贯性。编码器、解码器和注意力机制等技术手段,基本上能确保诗歌各句间的连贯,但无法提供作为诗歌核心的情感。语意是连贯了,情感仍不连贯,而情感不连贯,语意就不可能做到真正的连贯。

机器作品虽然不乏精彩之句,仍被普遍认为生硬,根本原因在于机器的情感及其表达都是学来的,而不是自己感悟出来的。已有机器会同人谈恋爱,但也是学来的,并非真的“堕落情网”、为爱而爱,只是“装模作样、逢场作戏”而已。

当然,生硬问题并非无药可救,且解决方法还不止一个。

第一,最容易解决的问题是情感表达,这可以从算法和训练着手。只要算法合理,且训练样本足够大,比如学习10亿人的情感表达,机器的作品或许就可以做到像人类作品一样“柔软”。

当然,机器作品所表现出来的“柔软”仍然只是一种拟人现象,而非真的人化。“纸上得来终觉浅,绝知此事要躬行。”“小冰”貌似学会了各种风格、掌握了很多技巧,但都只是经验积累,不可能有应对自如的反应和全面协调的能力。逻辑问题容易突破,但逻辑之上,想象和审美无法硬性灌输。所以,机器人还是机器,柔软仍欠自然。

第二,解决起来难度稍大的是情感计算问题。在信息技术的目录里,列有“情感计算”。单纯从技术上说,情感只要可计算,就是可表达的,而只要情感是有限的,就可以被完全计算出来,进而被表达出来。

就识别和理解而言,情感是一个非常抽象的客观存在,难以量化,就连我们人类本身也难以用非常具体的、量化的信息来确定情感,只能通过主观描述来表达,要让本身没有情感的机器来辨识情感,谈何容易。为了使机器有能力处理情感,必须教给机器如何定义情感、如何理解情感、如何表达情感,这就需要一套完善的、统一的标准。

问题是,即便借助“情感计算”,机器智能更加精细地掌握了人类情感及其表达,但机器能做的仍然只是模拟人的情感。科学家给机器输入一个数据,再让机器输出一个数据,告诉机器“该生气了”。这不是真正的情感,因为不是自发的。要能写诗作画,未来的机器智能还需要拥有自发的情感。

第三,最难解决的是人类情感尤其是创作中情感随机性问题。诗人作诗必须有情感,而人类作为不确定性动物,其情感具有很强的随机性,诗人往往囿于一时、一地、一心的特殊环境,在诗作里选用的事物、投入的情感、遵循的逻辑、体现的意境,全为当时那一刻特殊的环境、心理所左右。

不只是诗歌,别的文体写作也是随机过程。作者并不是把通篇文章想好了,胸有成竹,然后一气呵成。通常文思泉涌之下,一句没写完,后一句已浮上脑海,而在前一句出现前,后一句在哪里,连作者自己都不知道。有过因为电脑故障而丢失文字经历的人,一定对两次写作之间的明显甚至巨大差异记忆深刻。“人不能两次跳入同一条河”,在写作中可能比其他任何场合都更显示出其真理性!

然而,恰恰是这种不知从何而来的句子及其接连不断,即所谓的“意识流”,才是文字的气韵所在、创意所在、格局所在。所谓“原创”,就是指所有这些流出来的文字组合及其表达的情感、意境或观点,是别人不曾想过的或用过的,甚至是世界上从来没有出现过的,绝对的新鲜。而这最后一点恰是机器作品永远难以企及的,因为机器写作只能从自己的数据库里寻找现成材料。

让人乐观的是,由于机器具有学习优势,通过短时间里大量的学习、试错和修正,像AlphaGo Zero在左右手互博中,自行发现数千年里人类高手都没有发现的围棋原理那样,最终学会比人类更加巧妙甚至微妙的情感和情感表达,也是可能的。

七、 机器诗人作品的诗情画意何来?

机器不可能像人一样创作,这是艺术家的信念,机器写出来的诗词几可乱真,这是今天已经存在的现实。既然机器不能达到人类的情感和境界,何以机器诗人作品仍让人感觉到“诗性之美”?人类不承认机器诗作的地位和价值,是否只是人类面对自己所创造的机器而不肯放弃的傲慢?

在一次国际机器抽象画大赛上,许多画作当场被人高价买走。其中一位买家在解释自己购买原因时说:“我看到机器背后有凡·高的影子。”

或许,作这幅画的机器确实受过以凡·高作品为教材的训练,所以,在画风和效果上都留下了凡·高的影子。事实上,现在有作曲机器人,专门以巴赫为对象加以模仿,最后“创作”出来的曲子,把巴赫原创作品都比了下去。

无论机器画作背后有没有凡·高的影子,有一点是肯定的,机器作画时,并没有人类画家的复杂情感或主观意图,主动想表达什么。说直白些,再聪明的机器也不知道自己在干什么,人给它输入什么数据,对它怎么训练,机器就表达什么,完全不存在“真情流露”。

所以,即便机器画表达出某种情感,那一则只是观画者出自自身心情的反映或投射,无论面对画家的创作还是机器的制作,观赏者都会自觉不自觉地将自己的审美情趣和心态情绪投射于作品,从而看出某种“创意”或“情感”来。

二则机器作画毕竟经过系统学习,而其学习的对象就是人类的绘画作品,包括隐含其中的人类绘画技法和技法所表达的情感,所以,最后生成的画面必定含有人类情感和情感表达的元素包括情感与技法之间的关联。这些似曾相识的元素让观赏者在画作面前的自我投射有了最大的理由: 这比人类把未经任何训练、完全无师自通的动物涂鸦视为“抽象艺术”,要靠谱得多!当然,从另一个角度来看,动物作品哪怕毫无章法,毕竟是动物的创作,里面没有人类的干预,而机器作品中美学元素再多,仍然只是对人类的模拟。

八、 人机共融能促进艺术创作吗?

从目前机器作诗的效果来看,确实比不上人,尤其是人中高手,但机器时有佳句,也不可否认。这两个不无悖谬的现象放在一起,反而让科学家、工程师脑洞大开: 让机器出佳句,让诗人来给诗作情感以连贯性,不就能写出惊天地、泣鬼神的好诗来了?毕竟今天“梨花体”“乌青体”乃至“只用回车键”的诗人诗作太多,在诗意普遍缺乏的时代,让机器人“撞大运”也不失为繁荣诗歌创作的解决之道,哪怕明显带有“剑走偏锋”的倾向。

至少,没有一个诗人能够掌握比机器更多的中文字词及其用法、更多的典故出处,还有更多符号和符号所表达的意象。在解空间远远大于任何诗人的条件下,机器即便完全依靠“撞大运”,这碰出佳句来的概率也大大高于诗人。何况机器因为没有情感,逻辑也时常发生故障,不按常理出牌是其本质特征,反而少了些作诗时的陈规陋习,更容易在作为模糊地带的诗歌中频出黑马,刚好弥补诗人遣词造句时的创意贫乏。如此取长补短,岂非比诗人唱和更有好诗的生产力?

众所周知,“春风又绿江南岸”,当时这个“绿”字也费了好一番周折,才一字出佳句。谁知道机器“撞大运”,不会撞出一个更加传神的字眼和意境来?不要小看机器出佳句,素材的组合和字词的拼接本身就是一种创造。凡是原来没有的,现在有了,而且得到人的赏识,就不用管这个过程中有没有自觉意识和主体情感的介入。说到底,美不是创造的,而是发现的。机器只要能提供让人足以发现诗意的作品,真没必要追究是否人类意义上的“创作”!

图灵测试在机器作诗的场合同样灵得很!

按照“接受美学”的原理,艺术作品本身只是文本,其内在的美学价值是受众在接受过程中参与创作出来的,所谓“有一千个读者就有一千个哈姆雷特”,无非就是这个意思。既然如此,机器写作的“文本”等待着诗歌爱好者参与最后的完成,这本身不就是人—机共融的内在机制吗?

当然,也有人认为,在诗词写作上,人与人的合作都很难达成,需要经历、风格、气质的匹配。人与机器联手,不但难度更大,而且毫无意义,“机器懂什么?”其实,正因为机器不懂,听凭人类摆布,人—机合作才有可能,也才能有更高的生产水平、效率和质量。人与人合作之不易,多半是因为各执己见,互不相让。现在机器说:“我无所谓,你人想怎样就怎样。”如此一来,怎么还会有合作上的困难?圆规必须一条腿静止,另一条腿运动,才能画出圆来。现在人随便怎么动,机器就是不动,画出来的圆要想不好看,也难。

不过,对于如此偷懒的办法,诗歌爱好者尚且难以容忍,科学家更无法接受,“我就不相信解决不了机器的情感智能问题!”比如,造一个机器人,装上各种传感器,能感知环境当中的光影、味道、声音、阴晴等,同人类感知在范围、内容和强度上达到完全一致。人哪天摔倒了,身体哪个部位如何疼痛,哪天遇到漂亮女孩子,心情如何愉悦,一天里都莫名兴奋,如此等等,全部记下来。突然某一天,这个人想让机器作诗,机器不就能像人一样,创作出情感连贯的好诗了吗?

如此想法虽然不无想象,但根本上仍然囿于机器智能只是模拟人类的窠臼之中跳不出来。问题的问题是,谁都不知道哪天机器会自己想要作诗,而不是按照人设置的程序“开始作诗”。在ABC时代,即由人工智能、大数据和云计算共同构成的时代,物联网可以取代人的感官,借助传感器实现人类情感的输入,在技术上已经没有问题。但谁能决定机器人真会“心有灵犀一点通”,诗兴大发?

更要命的是这类观点内含一个未曾明言的预设,那就是人和机器一样,都是以前经验的简单累积。或许机器人能将每一次传感器传输过来的信息都按照相应的强度记录在案,但人类各次体验所产生的心理效应往往相去甚远。第一次被女孩子拒绝很心痛,第二次好一些,到后面没感觉了,再往后不被拒绝还会觉得心里不踏实。所以,从感受产生情感到因为情感驱动而写出佳作,有无数个中间环节需要打通,机器智能会一帆风顺吗?

九、 科学家让“小冰”写诗意欲何为?

费那么大的劲,就为让世界上多几首诗歌,科学家划得来吗?

科学家发明“小冰”,不是为了让机器像生产物质产品一样,生产精神产品,以便人类可以更加无所事事。“小冰”本身只是一个人类发明的技术作品。“功夫在诗外”,科学家探究“小冰”们的创作可能,另有所图。

人类研究机器写诗,根本上服务于某种哲学思考。今天,人工智能在确定性领域取得压倒性胜利之后,会不会进一步跨入不确定性领域,从而挤占越来越多人类的领地,这才是问题所在。“小冰”的诗歌能不能像人类作品一样充满想象,既是机器智能发展水平的指示,也是机器智能是否已成功占领至少部分占领不确定性领域的标志。

在审美领域,人类创作与机器模拟之间的最大区别在于: 机器的模拟犹如电影、游戏,是提前设定的、封闭的,而非像人类真实世界一样是随机而开放的。不是机器不能有灵魂,而是等机器有灵魂之后,所思所感未必与人类相同。登山则情满于山,观海则意溢于海,机器的审美与创作和人类大异其趣,是大概率事件。

确定性与不确定性这两个领域之间的鸿沟,不是那么容易被填平的!

再考虑得深一些,还可以看到在“小冰”写诗的问题上,人类内心的一个悖论性情结。

一方面,人需要诗歌是因为人有情感。生活与情感是诗意的最终命题,也是人类最终跟AlphaGo、“小冰”等机器智能分道扬镳的地方。虽然现在有网络写作等媒介和载体,但传统书写工具和形式本身就是诗意所在、有情载体,历史地形成的传统是人类生存的一部分,更不用说每个人在真实生活中付出的情感、陪伴和守护,这是冷冰冰的机器所无法复制和替代的。每一天的日升月落,简单而琐碎的日常生活,人与人在现实中的交往,素朴而温暖,平淡而实在,才酝酿出最大的诗意。

另一方面,因为人类已经把情感、审美等定位为人所专有的属性,所以,讨论机器有没有情感,最后都难免落入“循环定义”的窠臼: 命题之所以成立,是因为结论已经包含在前提中,看似自洽的命题其实只是一个自循环。如果我们坚持机器智能与人类智能是平行关系,那是否也可以定义未来可能出现的机器情感同人类情感也是平行关系?

当然,要这么说,首先必须明确,这里讨论的情感只是智能范畴之内的情感,而不是某种具有本体论地位的情感,类似“人之为人就在于人有情感”,否则就无法进行理性讨论。由于作为平行智能的机器智能不以具有情感为存在前提,未来如果真有“强人工智能”出现,机器也未必胜在具有比人更强大的情感,相反,更可能胜在机器没有情感,特别是没有人类引以为傲的那种情感上。

本文选自顾骏、郭毅可主编:《人与机器:思想人工智能》,上海大学出版社2018年8月版

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈