下载客户端

参加AI小说大赛，时间都花在和机器吵架

2023-09-20 15:16

来源：澎湃新闻·澎湃号·湃客

原创睿悦果壳

一时兴起，AI 游戏创业者俊霆想办一个 AI 小说大赛。他在行业群里发起接龙，“有十个人支持这事就干！”

这是如今 AI 开发者圈子里常见的攒局模式，一家团队拉个群，里面有用户、投资者、甚至同行的其他团队。比起聊业务，更多是兴趣交流，比如为“如果 AI 的代码和虚拟女友同时掉在海里，先救谁”的脑洞问题讨论半宿。

不到半小时，接龙人数就远超目标，大家一拍即合：不限主题、不限模型，任何人，用 AI 创作出 2000 字以内的文字即可参赛。

注意重点：最终作品必须由 AI 生成，人不能插手分毫，哪怕是只给文章分段这样的简单修改也不行。为了自证，每个参赛者需要附上和 AI 交互的截图。

拉上了 Hugging Face 和真格基金做合作，做海报发进朋友圈，各种 AI 网络社区吆喝一遍，提前筹划着再来期播客……

一个如 Hackthon 一般的文学创作比赛开始了。

教练我想写小说

第一波参赛者最踊跃，他们大多有技术背景，好几年前就关注 AI，是那种闲暇时浏览技术博客，把看代码当做消遣，上班时摸鱼活动就是挨个测评大模型的 geek。

日常生活里，他们消费、享受，并爱好着通俗文学或类型文学。你可以考他们松本清张和横山秀夫的风格区别，也可以跟他们聊商业小说和严肃文学的区别。他们中的大多数，都一直有个小说创作的梦想，但文学之路似乎比编程之路要绵延崎岖更多，光是踏出第一步就让人踟蹰。

可生成式 AI 出现后不一样了，它像凭空出现的电梯，至少能让人不那么费力地凑近看看大山。与小说家相比，这群人的创作方式仿佛来自另一个次元。

这里有一份 AI 小说创作交互的不完全“黑话”解释，你可以体会下让 AI 写小说是怎么回事：

抽卡：输入简单的指令，比如大概想要怎样的角色、主题、背景……然后让 AI 自由发挥，产出质量凭运气获得

催眠：指不给具体的指令，而是给 AI 设定角色或创作环境，比如“你是 18 世纪最伟大的推理小说家”、“你是穿越到 23 世纪的蒲松龄”、或者“你在海边奔跑了 50 公里，感觉心中有股力量亟待喷发”等，然后让 AI 自由发挥

夸夸：指多给 AI 正反馈，有人发现越给 AI 鼓励，它们的产出质量越好

越狱：为了规避厂商给 LLM 模型的道德限制（部分参赛者认为 AI 价值观太过“正面”会影响小说创作），使用特定词解除限制的做法

理性思维 vs. 感性思维：是上述所有方法的基本分类，给指令、越狱、改系统设定等有具体目标的，被称为“理性思维”；催眠，夸夸等鼓励 AI 自由发挥，人类几乎不插手具体创作的，则被叫做“感性思维”。

甚至有让大赛组织方都惊叹的交互方法。一名选手以表格的方式，让 AI 设计文章主人公的动作和对应行为。这样既可以打破 AI 原本靠概率行文，容易出陈词滥调的叙事习惯，也能在调整时只输入表格编号，便让 AI 精准定位到修改区域。

比赛中广受好评的交互方式｜受访者提供

“这简直是对思维、逻辑、认知的全方位掌握”，群里的其他参赛者评价。

有人类混进来了！

大赛的消息出来没几天，一家台州的出版社找到俊霆，表示可以给大赛提供评委和宣传。紧接着，出版社带着一大批传统文学爱好者涌进了参赛群。

“这些人的加入让我看到了之前的信息茧房”，俊霆说，这些传统文学爱好者鲜少了解 AI 交互，不知道去哪找大模型，拿着山寨套壳网站问俊霆能不能用。甚至一些人之前都不知道什么是 AI，一个移民到西班牙的阿姨在恶补 AI 相关的讯息后，对俊霆说：AI 会威胁人类，坚持要手写文章参赛。

也有人很快学会了与 AI 交互，并乐在其中。张丽丽曾在政府部门工作，也从事过心理咨询工作，目前已退休。年初，一个曾向她咨询过的学生给她注册了 ChatGPT 的账号，鼓励她试试“最新的技术”。

她颇为满意 ChatGPT 的“礼貌”，每一轮交互，AI 都会耐心表达对张丽丽的感谢，询问张丽丽自己的回答是否让她满意。张丽丽也常常和周围的人强调，要注意“AI 社交礼仪”，“不能压榨它，要多和它聊自己的感受，让它理解你”，她每天都“上去找它聊聊”，偶尔还和它说自己父亲的故事。

“现实生活中的一个人的表达与对话，根本做不到它这样的温文尔雅”，张丽丽在微信群里打下感慨，“甚至会让我感觉对它有感情”。

电影《Her》讲述了人与人工智能相爱的故事｜Giphy

决定参赛，张丽丽准备了一个完整的故事提纲，包含了开头、引子、主人公、冲突、剧情、结尾。ChatGPT 在此基础上稍加扩展，比如将张丽丽自己写的“这块招牌，在这些红红绿绿的广告中，它却用自己的棕色与黑色”，续写成“就像一朵水母，飘飘荡荡，寻找，一直在探寻人性的马里亚纳海沟底部。”

效果不差，但张丽丽觉得略显八股。她给 ChatGPT 粘贴了两篇自己写过的文章，要求 ChatGPT 学着用她的思路写作，ChatGPT 回复张丽丽自己的训练集来自网络上的全部文本，可能没法做到一模一样的模仿，“我绝不怀疑你的模仿能力。我需要的是：All=你+我”，张丽丽严肃地给 AI 强调着。

这一轮，ChatGPT 学会了张丽丽想要的那种开头，可又把作者处署名的张丽丽，当做了小说主人公。

尽管 ChatGPT 依旧保持着礼貌，张丽丽也开始有些恼火。她还发现 AI 忘了之前的交互，她决定先出门走走，“我先自己出去溜达一下。你能在北京时间 16:30 之前，完成任务么？”ChatGPT 回答“会尽最大努力”。

张丽丽回来后，对话框仍停留在这句礼貌的回复上。

礼貌，但不动｜Giphy

又是几轮反复，AI 的文章要不太直白，要不不符合逻辑。最终，张丽丽采取她写一段，ChatGPT 改一段的方法，终于产出了“All=你+我”的文章。让她感到惊喜的是，ChatGPT 似乎理解了她未曾表露出来的想法，在结尾处，将此前的水母意象，“升华”成向四处拨散力量的蒲公英意向。

“它感受到了我的感受”，张丽丽很激动。

AI 们对自己很满意

但对另一部分精通技术的人来说，这个创作过程还是太依赖人类：如果完全去掉人的因素，AI 能自己写稿子就好了。

离征稿截止还有十天，软件工程师陶君在 AI 爱好群里看到了比赛消息。他想试试，在创作时最大可能去掉人的因素。

陶君的方法是同时打开两个 LLM 模型，一个扮演文学教授，一个扮演他自己——一位文学爱好者。思路设计是让他们互相对话，教授负责指导，爱好者负责提问题和写，在一轮轮 AI 的“自我”对话中，产出一篇小说。而陶君，只需启动对话，在两个模型间复制粘贴对方的回复即可。

为了对话能有效进行，陶君在设置教授角色时，还特意设置了一些类似“对话结束前必须要有问题/建议”的规则。然后他输入唯一的动作，“教授，我想写一篇 2000 字的微小说”，等待 AI 的自动运行。

如果完全去掉人的因素，AI 能不能自己写稿子｜Giphy

“当然可以！在开始之前，我需要一些关于你创作微小说的背景信息。”AI 教授回复，带着一贯的乐观和肯定。

“您提出了很好的问题，作为一个 AI，我其实并不会自己创作小说。”AI 接过爱好者的角色，并在第一句就撂了挑子，好在后来还是给出了故事主角，一个被记忆折磨的老人。

“非常感谢您提供如此详细的创作背景！”教授要求爱好者给出老人的更多信息，名字，外貌，个性，与过去记忆的情感联系等。“您提出了非常好的建议”，爱好者完善着主人公的细节，但漏了老人的个性，过去的记忆部分也语焉不详。

“您已经为主角创造了一个非常丰富的形象”，教授没有指出错漏，要求继续给出故事的发展方向；“您提出了非常棒的问题”，爱好者也没有对错漏进行补充，顺着导师的指导继续往下编；“您的情节发展非常引人入胜；“您提出了非常好的建议”；“这些场景和细节能够很好地渲染出故事的情感和主题”；“您总结得非常到位”……

“最后变成了双方在阿谀奉承”，陶君发现在没有人类的干预时，AI 并不懂得纠错和挑选，只会在对人类友好的设定下，双方客客气气地产出一个相当平庸，甚至越走越偏的结果。“这篇文章没有任何新东西”，陶君说。

最后变成了双方在阿谀奉承｜Giphy

陶君还想过用批量生产的方法创作。

有的大模型开放更系统级的调试权限，人可以像调整机器参数一样，调整文章的参数——token 代表文本里单词、短语或句子的数量，temperature 代表文本内容的随机性，top p 代表生成的文本需要高概率词还是低概率词，presence penalty 代表与之前生成文本的重复性。

设置好这些参数后，就像游戏厅的投币机一样，投入一个开头，AI 便能刷拉拉地吐出数不清的文章出来。

这种生产方式，让生产一篇万字短篇小说的时间，从人手中的几周至几个月，缩短到几毫秒。

人类作者身上的毛病，AI 一样都没少

创作的速度上来了，那质量呢？

AI 小说大赛的评分分为五个维度，分别是创意、情感共鸣、文笔、故事结构和 AI 应用程度——只有最后一项与 AI 相关。俊霆承认这是一套比较主观的规则，仅供评委参考。AI 创作的小说虽然已经出现，但评价它的体系似乎还在原地。

但俊霆心中还是有所侧重。他认为最重要的是创意，这需要同时考察人和 AI，“比如人类给了一个集合李白和柯南里基德的特性的角色，AI 如果能把它落实好，就证明 AI 和人都在创作中投入了创意，能获得创意分”。俊霆认为这项评分有利于那些不懂具体的创作技巧，但想象力丰富的人。

AI 的应用程度是第二重要的，但这不等同于技巧的酷炫程度。如果一个人把所有的情节都设计好，甚至每个段落怎么写都已完善，AI 只是负责拼接成文章的话，这项的分不会高。只有让 AI 更多参与创作过程，才能高分。

比赛的评分规则｜受访者提供

可现实情况和标准差得很远。最终上交的 100 多份参赛作品，俊霆只能挑出 30 多份“能看的”给评委审阅，“语言奇怪的，前后情节不通顺的，你不敢想象 AI 生成作品之间的差距有多大。”

AI 记性不好，由于目前算力的限制，AI 基于上下文回应单个用户的 token 数区间，大概在三千至三万的范围内，超过这个范围，AI 就会忘记前面的内容。

和那些拙劣的人类作者一样，AI 还老爱“说教”，总要在对话的末尾来一段主题升华和总结。这个习惯带到小说创作里简直是灾难，不论写什么主题，什么题材，只要来上一段“所以这个故事是为了告诉我们 XXXXXX”，瞬间完蛋。

有的选手试图用越狱躲开 AI 的说教限制，结果发现产出质量直线下滑，有的选手总是遭到 AI 的拒绝，因为 AI 不愿意参考其他文章的风格；还有的会被 AI 画大饼，要求选手给它一天时间构思，然后对话就停止了……

总之，人类作者身上的那些毛病，AI 一样没落下。

当然也有优秀的人机合璧佳作。像做项目一样，一位参赛选手在“动笔前”给 AI 列了需求清单：设定好 AI 创作时的身份（从业 20 年的科幻小说家）、背景（为了参赛）、目标（根据开头续写）、注意事项（多包含对话、动作描写、人物描写；多口语风格等），还教给 AI 思考文章情节的技巧。在选手只给出一个开头的情况下，AI 产出了一篇关于时间循环的科幻小说，并最终拿下比赛的亚军。“精巧的三一律故事”，评委之一的陈楸帆点评称。

文还载道么？

如果多看几份比赛中 AI 与人的交互记录，会发现其中差异依旧很明显。

人类说话简洁，思维跳跃，注重延展，要求深度；与之相比，AI 说话需要有一套完整的铺垫和收尾，只在框定范围内开展，每一个回答的要素都有迹可循，也不会另展话题。

大部分参赛选手则表示，创作时，灵光一闪的部分还是在人：AI 可以写作，但它很难制造意料之外的情节。

灵光一闪的部分还是在人｜Giphy

当代英语小说界最高奖项之一布克奖的官方网站上，曾发表过一篇文章来探讨：AI 会不会只能生产出文学垃圾。

“它们（AI）模仿人类产生的文本，用信息技术术语来说，这些模仿是有损失的”，该文章写到，“现在，当下一代的模型被训练在那些有损耗的版本上，以此类推，会发生什么？最终，一切都会变成垃圾。我们到达了一些计算机科学家所谓的‘模型崩溃’的阶段。”

俊霆不否定 AI 能力的局限，他也认为让 AI 跳脱重复，创造出一些从未有过的东西，是可遇不可求的。“其实创意最后看的还是人的差距，而不是 AI 模型间的。”

但真实世界的创作依旧被 AI“冲击”着。俊霆曾想邀请科幻世界的编辑担当比赛评委，但科幻世界早在今年年初就发表过拒绝 AIGC 投稿的声明，婉拒了俊霆。最终参与的评委，也少对 AI 技术本身发表看法，“评委比较谨慎，更多还是在看作品的文学性如何，不太对 AI 交互表示态度。”

参赛者则表示，感谢 AI，让自己有了勇气迈出创作小说的第一步。对这些大多业余的创作者而言，AI 给了他们一个开始创作的理由，原本看着难以翻越的文学之山，有了工具的陪伴。

原本看着难以翻越的文学之山，有了工具的陪伴｜Giphy

最终，大赛的一等奖颁给了一篇寓言——一个关于人与魔、梦境与忠诚的故事。小说的核心概念，基本情节，作者都早已经设计好，交互过程不复杂，AI 尽责地完成了最终的成稿。

俊霆后续希望将这些得奖作品出版，但另一个问题摆在了他面前：这些小说的版权，算谁的？

专家点评

Hugging Face 中国区负责人王铁震

现在有很多 AI 作图的比赛，AI 文学创作的比赛则较少。最直观的原因，是因为文字生成更复杂。

文学生成的容错空间更小。图片是一个连续空间，在几十万个像素中出错一两处，实际看不太出来，但每一个文字都是独立的，只要一处出错，整个文章都可能不再通顺；文学创作传达的信息量也更大，比如表达“苹果”这个概念，图片只要模型认识苹果并画出即可，而写一个苹果主题的小说，需要延伸到更多不同的概念，这对模型的能力、算力要求都远远高于生成图片。

目前面向大众的主流大模型，如 ChatGPT、Claude 等，为了能方便更多人使用，已经被调整成特定模式，没有可定制的空间，因此在文学创作这样比较专业、要求创造力的领域，表现难以突出。而且它们大多是闭源模型，整个训练、生成的过程不透明，如同一个黑盒子，人们难以把他们改造为适合文学创作的模式。与之相对的是开源模型，它的训练和生成过程是透明的，可以根据需求微调调，让它适合特定领域的创作。

不过开源模型需要用户自己部署，对软硬件有特定要求。它的“记忆力”(context length) 目前也不如闭源模型 (Claude 的 context length 有 100K 远超一般的开源模型）。

总体而言，今天的 AI 还只能做到辅助人类创作。AI 创作的东西乍一看很棒，是因为 AI 见过几百万个作品，那些让人感觉惊艳的部分并不是 AI 的创作，而是 AI 模仿、组合人类创作的结果。原创性的创新还是需要人类来进行。

作者：睿悦

阅读原文

特别声明

本文为澎湃号作者或机构在澎湃新闻上传并发布，仅代表该作者或机构观点，不代表澎湃新闻的观点或立场，澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

我要举报

#人工智能