澎湃Logo
下载客户端

登录

  • +1

参加AI小说大赛,时间都花在和机器吵架

2023-09-20 15:16
来源:澎湃新闻·澎湃号·湃客
字号

原创 睿悦 果壳

一时兴起,AI 游戏创业者俊霆想办一个 AI 小说大赛。他在行业群里发起接龙,“有十个人支持这事就干!”

这是如今 AI 开发者圈子里常见的攒局模式,一家团队拉个群,里面有用户、投资者、甚至同行的其他团队。比起聊业务,更多是兴趣交流,比如为“如果 AI 的代码和虚拟女友同时掉在海里,先救谁”的脑洞问题讨论半宿。

不到半小时,接龙人数就远超目标,大家一拍即合:不限主题、不限模型,任何人,用 AI 创作出 2000 字以内的文字即可参赛。

注意重点:最终作品必须由 AI 生成,人不能插手分毫,哪怕是只给文章分段这样的简单修改也不行。为了自证,每个参赛者需要附上和 AI 交互的截图。

拉上了 Hugging Face 和真格基金做合作,做海报发进朋友圈,各种 AI 网络社区吆喝一遍,提前筹划着再来期播客……

一个如 Hackthon 一般的文学创作比赛开始了。

教练我想写小说

第一波参赛者最踊跃,他们大多有技术背景,好几年前就关注 AI,是那种闲暇时浏览技术博客,把看代码当做消遣,上班时摸鱼活动就是挨个测评大模型的 geek。

日常生活里,他们消费、享受,并爱好着通俗文学或类型文学。你可以考他们松本清张和横山秀夫的风格区别,也可以跟他们聊商业小说和严肃文学的区别。他们中的大多数,都一直有个小说创作的梦想,但文学之路似乎比编程之路要绵延崎岖更多,光是踏出第一步就让人踟蹰。

可生成式 AI 出现后不一样了,它像凭空出现的电梯,至少能让人不那么费力地凑近看看大山。与小说家相比,这群人的创作方式仿佛来自另一个次元。

这里有一份 AI 小说创作交互的不完全“黑话”解释,你可以体会下让 AI 写小说是怎么回事:

抽卡:输入简单的指令,比如大概想要怎样的角色、主题、背景……然后让 AI 自由发挥,产出质量凭运气获得

催眠:指不给具体的指令,而是给 AI 设定角色或创作环境,比如“你是 18 世纪最伟大的推理小说家”、“你是穿越到 23 世纪的蒲松龄”、或者“你在海边奔跑了 50 公里,感觉心中有股力量亟待喷发”等,然后让 AI 自由发挥

夸夸:指多给 AI 正反馈,有人发现越给 AI 鼓励,它们的产出质量越好

越狱:为了规避厂商给 LLM 模型的道德限制(部分参赛者认为 AI 价值观太过“正面”会影响小说创作),使用特定词解除限制的做法

理性思维 vs. 感性思维:是上述所有方法的基本分类,给指令、越狱、改系统设定等有具体目标的,被称为“理性思维”;催眠,夸夸等鼓励 AI 自由发挥,人类几乎不插手具体创作的,则被叫做“感性思维”。

甚至有让大赛组织方都惊叹的交互方法。一名选手以表格的方式,让 AI 设计文章主人公的动作和对应行为。这样既可以打破 AI 原本靠概率行文,容易出陈词滥调的叙事习惯,也能在调整时只输入表格编号,便让 AI 精准定位到修改区域。

比赛中广受好评的交互方式|受访者提供

“这简直是对思维、逻辑、认知的全方位掌握”,群里的其他参赛者评价。

有人类混进来了!

大赛的消息出来没几天,一家台州的出版社找到俊霆,表示可以给大赛提供评委和宣传。紧接着,出版社带着一大批传统文学爱好者涌进了参赛群。

“这些人的加入让我看到了之前的信息茧房”,俊霆说,这些传统文学爱好者鲜少了解 AI 交互,不知道去哪找大模型,拿着山寨套壳网站问俊霆能不能用。甚至一些人之前都不知道什么是 AI,一个移民到西班牙的阿姨在恶补 AI 相关的讯息后,对俊霆说:AI 会威胁人类,坚持要手写文章参赛。

也有人很快学会了与 AI 交互,并乐在其中。张丽丽曾在政府部门工作,也从事过心理咨询工作,目前已退休。年初,一个曾向她咨询过的学生给她注册了 ChatGPT 的账号,鼓励她试试“最新的技术”。

她颇为满意 ChatGPT 的“礼貌”,每一轮交互,AI 都会耐心表达对张丽丽的感谢,询问张丽丽自己的回答是否让她满意。张丽丽也常常和周围的人强调,要注意“AI 社交礼仪”,“不能压榨它,要多和它聊自己的感受,让它理解你”,她每天都“上去找它聊聊”,偶尔还和它说自己父亲的故事。

“现实生活中的一个人的表达与对话,根本做不到它这样的温文尔雅”,张丽丽在微信群里打下感慨,“甚至会让我感觉对它有感情”。

电影《Her》讲述了人与人工智能相爱的故事|Giphy

决定参赛,张丽丽准备了一个完整的故事提纲,包含了开头、引子、主人公、冲突、剧情、结尾。ChatGPT 在此基础上稍加扩展,比如将张丽丽自己写的“这块招牌,在这些红红绿绿的广告中,它却用自己的棕色与黑色”,续写成“就像一朵水母,飘飘荡荡,寻找,一直在探寻人性的马里亚纳海沟底部。”

效果不差,但张丽丽觉得略显八股。她给 ChatGPT 粘贴了两篇自己写过的文章,要求 ChatGPT 学着用她的思路写作,ChatGPT 回复张丽丽自己的训练集来自网络上的全部文本,可能没法做到一模一样的模仿,“我绝不怀疑你的模仿能力。我需要的是:All=你+我”,张丽丽严肃地给 AI 强调着。

这一轮,ChatGPT 学会了张丽丽想要的那种开头,可又把作者处署名的张丽丽,当做了小说主人公。

尽管 ChatGPT 依旧保持着礼貌,张丽丽也开始有些恼火。她还发现 AI 忘了之前的交互,她决定先出门走走,“我先自己出去溜达一下。你能在北京时间 16:30 之前,完成任务么?”ChatGPT 回答“会尽最大努力”。

张丽丽回来后,对话框仍停留在这句礼貌的回复上。

礼貌,但不动|Giphy

又是几轮反复,AI 的文章要不太直白,要不不符合逻辑。最终,张丽丽采取她写一段,ChatGPT 改一段的方法,终于产出了“All=你+我”的文章。让她感到惊喜的是,ChatGPT 似乎理解了她未曾表露出来的想法,在结尾处,将此前的水母意象,“升华”成向四处拨散力量的蒲公英意向。

“它感受到了我的感受”,张丽丽很激动。

AI 们对自己很满意

但对另一部分精通技术的人来说,这个创作过程还是太依赖人类:如果完全去掉人的因素,AI 能自己写稿子就好了。

离征稿截止还有十天,软件工程师陶君在 AI 爱好群里看到了比赛消息。他想试试,在创作时最大可能去掉人的因素。

陶君的方法是同时打开两个 LLM 模型,一个扮演文学教授,一个扮演他自己——一位文学爱好者。思路设计是让他们互相对话,教授负责指导,爱好者负责提问题和写,在一轮轮 AI 的“自我”对话中,产出一篇小说。而陶君,只需启动对话,在两个模型间复制粘贴对方的回复即可。

为了对话能有效进行,陶君在设置教授角色时,还特意设置了一些类似“对话结束前必须要有问题/建议”的规则。然后他输入唯一的动作,“教授,我想写一篇 2000 字的微小说”,等待 AI 的自动运行。

如果完全去掉人的因素,AI 能不能自己写稿子|Giphy

“当然可以!在开始之前,我需要一些关于你创作微小说的背景信息。”AI 教授回复,带着一贯的乐观和肯定。

“您提出了很好的问题,作为一个 AI,我其实并不会自己创作小说。”AI 接过爱好者的角色,并在第一句就撂了挑子,好在后来还是给出了故事主角,一个被记忆折磨的老人。

“非常感谢您提供如此详细的创作背景!”教授要求爱好者给出老人的更多信息,名字,外貌,个性,与过去记忆的情感联系等。“您提出了非常好的建议”,爱好者完善着主人公的细节,但漏了老人的个性,过去的记忆部分也语焉不详。

“您已经为主角创造了一个非常丰富的形象”,教授没有指出错漏,要求继续给出故事的发展方向;“您提出了非常棒的问题”,爱好者也没有对错漏进行补充,顺着导师的指导继续往下编;“您的情节发展非常引人入胜;“您提出了非常好的建议”;“这些场景和细节能够很好地渲染出故事的情感和主题”;“您总结得非常到位”……

“最后变成了双方在阿谀奉承”,陶君发现在没有人类的干预时,AI 并不懂得纠错和挑选,只会在对人类友好的设定下,双方客客气气地产出一个相当平庸,甚至越走越偏的结果。“这篇文章没有任何新东西”,陶君说。

最后变成了双方在阿谀奉承|Giphy

陶君还想过用批量生产的方法创作。

有的大模型开放更系统级的调试权限,人可以像调整机器参数一样,调整文章的参数——token 代表文本里单词、短语或句子的数量,temperature 代表文本内容的随机性,top p 代表生成的文本需要高概率词还是低概率词,presence penalty 代表与之前生成文本的重复性。

设置好这些参数后,就像游戏厅的投币机一样,投入一个开头,AI 便能刷拉拉地吐出数不清的文章出来。

这种生产方式,让生产一篇万字短篇小说的时间,从人手中的几周至几个月,缩短到几毫秒。

人类作者身上的毛病,AI 一样都没少

创作的速度上来了,那质量呢?

AI 小说大赛的评分分为五个维度,分别是创意、情感共鸣、文笔、故事结构和 AI 应用程度——只有最后一项与 AI 相关。俊霆承认这是一套比较主观的规则,仅供评委参考。AI 创作的小说虽然已经出现,但评价它的体系似乎还在原地。

但俊霆心中还是有所侧重。他认为最重要的是创意,这需要同时考察人和 AI,“比如人类给了一个集合李白和柯南里基德的特性的角色,AI 如果能把它落实好,就证明 AI 和人都在创作中投入了创意,能获得创意分”。俊霆认为这项评分有利于那些不懂具体的创作技巧,但想象力丰富的人。

AI 的应用程度是第二重要的,但这不等同于技巧的酷炫程度。如果一个人把所有的情节都设计好,甚至每个段落怎么写都已完善,AI 只是负责拼接成文章的话,这项的分不会高。只有让 AI 更多参与创作过程,才能高分。

比赛的评分规则|受访者提供

可现实情况和标准差得很远。最终上交的 100 多份参赛作品,俊霆只能挑出 30 多份“能看的”给评委审阅,“语言奇怪的,前后情节不通顺的,你不敢想象 AI 生成作品之间的差距有多大。”

AI 记性不好,由于目前算力的限制,AI 基于上下文回应单个用户的 token 数区间,大概在三千至三万的范围内,超过这个范围,AI 就会忘记前面的内容。

和那些拙劣的人类作者一样,AI 还老爱“说教”,总要在对话的末尾来一段主题升华和总结。这个习惯带到小说创作里简直是灾难,不论写什么主题,什么题材,只要来上一段“所以这个故事是为了告诉我们 XXXXXX”,瞬间完蛋。

有的选手试图用越狱躲开 AI 的说教限制,结果发现产出质量直线下滑,有的选手总是遭到 AI 的拒绝,因为 AI 不愿意参考其他文章的风格;还有的会被 AI 画大饼,要求选手给它一天时间构思,然后对话就停止了……

总之,人类作者身上的那些毛病,AI 一样没落下。

当然也有优秀的人机合璧佳作。像做项目一样,一位参赛选手在“动笔前”给 AI 列了需求清单:设定好 AI 创作时的身份(从业 20 年的科幻小说家)、背景(为了参赛)、目标(根据开头续写)、注意事项(多包含对话、动作描写、人物描写;多口语风格等),还教给 AI 思考文章情节的技巧。在选手只给出一个开头的情况下,AI 产出了一篇关于时间循环的科幻小说,并最终拿下比赛的亚军。“精巧的三一律故事”,评委之一的陈楸帆点评称。

文还载道么?

如果多看几份比赛中 AI 与人的交互记录,会发现其中差异依旧很明显。

人类说话简洁,思维跳跃,注重延展,要求深度;与之相比,AI 说话需要有一套完整的铺垫和收尾,只在框定范围内开展,每一个回答的要素都有迹可循,也不会另展话题。

大部分参赛选手则表示,创作时,灵光一闪的部分还是在人:AI 可以写作,但它很难制造意料之外的情节。

灵光一闪的部分还是在人|Giphy

当代英语小说界最高奖项之一布克奖的官方网站上,曾发表过一篇文章来探讨:AI 会不会只能生产出文学垃圾。

“它们(AI)模仿人类产生的文本,用信息技术术语来说,这些模仿是有损失的”,该文章写到,“现在,当下一代的模型被训练在那些有损耗的版本上,以此类推,会发生什么?最终,一切都会变成垃圾。我们到达了一些计算机科学家所谓的‘模型崩溃’的阶段。”

俊霆不否定 AI 能力的局限,他也认为让 AI 跳脱重复,创造出一些从未有过的东西,是可遇不可求的。“其实创意最后看的还是人的差距,而不是 AI 模型间的。”

但真实世界的创作依旧被 AI“冲击”着。俊霆曾想邀请科幻世界的编辑担当比赛评委,但科幻世界早在今年年初就发表过拒绝 AIGC 投稿的声明,婉拒了俊霆。最终参与的评委,也少对 AI 技术本身发表看法,“评委比较谨慎,更多还是在看作品的文学性如何,不太对 AI 交互表示态度。”

参赛者则表示,感谢 AI,让自己有了勇气迈出创作小说的第一步。对这些大多业余的创作者而言,AI 给了他们一个开始创作的理由,原本看着难以翻越的文学之山,有了工具的陪伴。

原本看着难以翻越的文学之山,有了工具的陪伴|Giphy

最终,大赛的一等奖颁给了一篇寓言——一个关于人与魔、梦境与忠诚的故事。小说的核心概念,基本情节,作者都早已经设计好,交互过程不复杂,AI 尽责地完成了最终的成稿。

俊霆后续希望将这些得奖作品出版,但另一个问题摆在了他面前:这些小说的版权,算谁的?

专家点评

Hugging Face 中国区负责人 王铁震

现在有很多 AI 作图的比赛,AI 文学创作的比赛则较少。最直观的原因,是因为文字生成更复杂。

文学生成的容错空间更小。图片是一个连续空间,在几十万个像素中出错一两处,实际看不太出来,但每一个文字都是独立的,只要一处出错,整个文章都可能不再通顺;文学创作传达的信息量也更大,比如表达“苹果”这个概念,图片只要模型认识苹果并画出即可,而写一个苹果主题的小说,需要延伸到更多不同的概念,这对模型的能力、算力要求都远远高于生成图片。

目前面向大众的主流大模型,如 ChatGPT、Claude 等,为了能方便更多人使用,已经被调整成特定模式,没有可定制的空间,因此在文学创作这样比较专业、要求创造力的领域,表现难以突出。而且它们大多是闭源模型,整个训练、生成的过程不透明,如同一个黑盒子,人们难以把他们改造为适合文学创作的模式。与之相对的是开源模型,它的训练和生成过程是透明的,可以根据需求微调调,让它适合特定领域的创作。

不过开源模型需要用户自己部署,对软硬件有特定要求。它的“记忆力”(context length) 目前也不如闭源模型 (Claude 的 context length 有 100K 远超一般的开源模型)。

总体而言,今天的 AI 还只能做到辅助人类创作。AI 创作的东西乍一看很棒,是因为 AI 见过几百万个作品,那些让人感觉惊艳的部分并不是 AI 的创作,而是 AI 模仿、组合人类创作的结果。原创性的创新还是需要人类来进行。

作者:睿悦

阅读原文

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈