澎湃Logo
下载客户端

登录

  • +1

理工男告诉你,你们以为的网络小说生成器并不存在

澎湃新闻记者 莫琪
2017-03-24 11:48
来源:澎湃新闻
异次元 >
字号

起点低身价高,多是非的网文作家们最近又被“爆”出条潜规则:小说不用写,可以直接拿软件生成?

该传闻犹如平地一声雷炸出了一堆地下“网文生成器”,xx自作助手、xx作者、xx写作、xx生成器……小到两三字的人名大到数百字的桥段,从玄幻的恩仇杀戮到言情的不可描述,读者们发现这些软件统统能“写”。

还是原来的配方,还是熟悉的味道。这让读者们开始怀疑自己看的小说,到底是人写出来的,还是用软件生成出来的?难道现在写网文降级到复制粘贴的难度吗?

为此,澎湃新闻联系到以生成器量多闻名的玄派网创始人、早期生成器作者谢坚,他表示,所谓的“网络小说生成器”不存在,以目前的技术软件不可能自动生成小说。

生成器只是字库

“字词生成器这种东西实际上早已存在的,比如风水取名网站,”谢坚认为,公众对所谓的“网文生成器”有点反应过度了。

2011年,谢坚还是个程序员,这一年他无意触发了两个“大事开关”,第一个是他知道了比特币并于次年入行,两年内身家过千万;第二个开关在他(网名疯狂小强)当时所写的都市黑客小说里,为方便长篇创作他给自己写了个网页插件,用于自动生成人物名字,没想到原本私用的工具很快被朋友一传十十传百,成了最早期的网文写作工具,甚至至今仍有5000余人次的日访问量。

不经意激起的水花让谢坚意识到网络写作者们的需求,几年内他陆续制作了地名、书名、外貌、招式等十余个生成器。谢坚介绍,所谓的“生成器”其实就是经过了优化的字库,能按照一定规律组合生成词组、句子、段落。

生成器的主要原理是对关键词的自定义组合,通过构建一些有规律的范式,将关键词进行替换。例如,古代服装描写的规律,一般的公式都是:颜色+工艺+图样+料子+样式,这五部分组成。以此公式生成:石青弹墨藤纹云锦大袖衣。

同样的逻辑运用到玄幻、仙侠和魔幻词汇,就可以制作出“功法秘籍生成器”“招式名称生成器”“法宝武器生成器”“天材异宝生成器”“仙禽异兽生成器”“灵丹妙药生成器”等系列的生成器。

更复杂些,诸如生成一段描述古代女子外貌的文字,则是大量同类型词在固定公式里的应用,如公式:“她有着{空缺词},身穿一件{空缺词},逶迤拖地{空缺词},身披{空缺词}”,就能生出“她有着粉红的鸭蛋脸,身穿一件暗纹刻丝黄玫瑰纹样花软缎薄衫,逶迤拖地刺绣纹绣裙,身披玫瑰粉三镶盘金如意纹花软缎。”“她有着白净的娃娃脸,身穿一件印花宝瓶纹样十样锦鸡心领窄袖比甲,逶迤拖地淡蓝色彩绣月华裙,身披淡金底暗纹刻丝碧霞罗单罗纱。”等多种版本。

制作生成器的最大难点在于字库的建立。具体方法有很多,有的是查古典典籍,从诸如《道藏》《易经》之类的书籍中选取自己所需要的词汇。曾有作者直接从老子的《道德经》第三十九章,取其中十一字创作出武功秘籍的名称。

谢坚表示自己所做的生成器完成不了传闻的自动生成网文的功能,他再以书名生成器为例说明生成器的局限性,“制作过程需要采集大量类似的书名,并根据书名将程序进行训练输出,但得到的顶多是类型化的书名,名词是可以产生,这是根据相似性产生的数据。但目前的生成器在故事情节上缺少深度学习的能力,简单说就是不会编故事”。

谢坚将生成器定性为写作的“辅助工具”,只能给出小说的片段样本,而无法自主创造出故事情节,对于市面上直接使用生成段落(尤其女频),将“写书”变成“编书”,甚至因此引发抄袭争议的作者,他表示“只能说太懒了”。

网文可能是AI占领的第一类小说

谢坚写的生成器其实很早就出名了,2012年是他作为程序员很风光的一年,那年他凭着自己写的软件引起众多媒体关注,但技术是提高生产力还是覆盖创造力?是“风来了”还是“狼来了”?没人说得准,所以普遍很警惕。

“2012年有家媒体登了篇新闻,说出现了种软件只要选定关键字就可以生成小说,还有一张名为‘穿越小说古代女人外貌描写生成器’的图,我的第一反应是有人抄袭了我的软件创意。仔细一看这个软件才恍然大悟,这个界面是用工具画出来的,”谢坚猜测,可能是记者看到了他们网站的内容但又觉得网页版不够新闻价值,于是找人DIY了这么一个界面。

“可能有人会觉得网文写作软件抹黑了网络作家的名声,他们会认为大多数网文都是生成出来的,继而觉得网文没有价值,”这是谢坚遇到过最大的质疑。

“以前是听说过有人拿生成器生成的段落拼拼成文的,也有真以此谋生的,但现在这套不吃香了,读者能明显分辨出这种写法就是注水。”在他看来读者的要求恰恰降低了作者拿生成器写文的可能性。

那为什么大家会觉得“网络小说生成器”是存在的呢?也许是近年来屡屡用软件写诗、用机器人写新闻稿的消息,这无形增大了人们对人工智能的想象。那经过表述模糊的诗、公式化的新闻稿,人工智能离小说还有多远的距离?

“网文是有套路有模式的,如果拆分成逻辑感比较强的环节,理论上的确能用软件做出来。”谢坚认为网文甚至可能成为人工智能攻陷小说创作的第一垒。

作为个理工男,谢坚毫不掩饰自己对人工智能在文科前景的看好,“该发展的就应该发展,能实现的必然有人会实现。”他认为技术的发展会让人类的生产力进一步提高,随着人工智能技术的不断完善,在一些逻辑性非常强的领域,肯定能够带来非常大的效率提升,甚至在创意领域部分取代人类也不是不可能。只要经过软件编写者的精心设计,无论是非虚构类的文学,还是虚构类文学,AI都有可能创作出来。

去年在日本,一篇由人设定男女主人公和故事梗概,人工智能负责组合词汇,构成的小说入围了“星新一”文学奖,并成功通过初审。

记者问谢坚,同样是用软件生成文本,为什么用软件写诗就受捧,用软件写网文却争议四起?

他分析,读者对用软件写文并不反感,而是厌恶抄袭,“有些生成工具直接将现有的小说存档,在需要的时候直接搜索就可调取相关的内容,然后复制粘贴过来。”这造成了很多读者以为用软件写文就是抄别人文。

团队写作更有利

虽然“网络小说生成器”不存在,但事实上,在中国的确诞生过用软件编写的网文。

比如早在10年前就出现过一本叫《宇宙巨校闪级生》的书,简介已足够弹眼落睛:“本书共有111部,分为1111卷,按纯文本(txt格式)计算,本书的总字数超过340兆,如换成中文计算:总字数应该不会少于一亿七千万字。”而这样的字数用VB开发,总共也就只用了三十多个小时就生成了。

但是,这样生成出来的东西,具有可读性么?文中存在大量的重复性的词句和逻辑性的错误,如非猎奇,实在不是个好读的文学作品。

技术未到前景看好,谢坚称相比开发软件写文如今更现实的是开发工具提高写作效率。他正在研发一个软件能把一部小说拆分成大纲、人物、细节等多个环节,分配给团队成员同步进行创作,相当于像动漫、编剧团队的模式。

从经济上讲,一个小说产生的盈利能养活一个团队,如有AI配合的话三小时可稳定产出万余字。

从内容上讲,网络小说对作者的文笔、用词准确度要求没那么高,看重的是故事、好的阅读体验、想象空间,谢坚认为这给团队协作提供了可能性——把小说软件工程一样开发,确定内容后实施标准化流程生产。他为此分析了一些比较火的书,如《斗破苍穹》《鬼吹灯》,提取商业价值最大的桥段套路作为写作参考。

那么这种团队作战对其他孤军奋战的作者来说是否不公平?谢坚却告诉记者“团队写作”才是圈内的潜规则。

“将近一半的大神作家有专业的创作团队,这在业内半公开,就是所谓的大神工作室。流程是大神指定小说的大纲指向,然后下面的人负责具体写,用词习惯保持风格统一。”在谢坚看来,网络小说跟传统严肃文学有区别,网文的读者主要是用于打发时间,即便是工作室哪怕枪手代写,只要创作风格统一读者还是买账的。

目前谢坚手下的三人创作团队正在以每天6000余字的速度进攻都市、修真类网文,年内他开发的“团队写作”软件就能投入测试,“做叫座不叫好的作品”是他初期的目标。

无论软件写文,还是团队写文都是法律框架下的市场探索,读者大可不必因作者身份进行预估,大可读了再说,虽然行业的潜规则层出不穷,但至少你的个人体验是可信的。

    校对:施鋆
    澎湃新闻报料:021-962866
    澎湃新闻,未经授权不得转载
    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈