多个网络小说平台开发了AI写作智能体,网络文学是最早拥抱AIGC的文学门类之一。
“在夜幕的掩护下,一个全身黑衣的年轻男子以坚定的步伐,在迷雾芜谷中穿行。他的每一步都精确得体,如同一位优雅的舞者,在危险的世界中找寻自己的节奏。”
这是网络小说《天命使徒》的开篇。这部篇幅超过100万字、主要人物就有8位的长篇小说,文本几乎全部由国内人工智能大语言模型(下称“大模型”)生成。
《天命使徒》由华东师范大学传播学院院长王峰和他的团队制作,于2024年4月发布。这部小说发布后的半年里,这个团队又开发了长篇小说创作平台“灵咔灵咔”,通过这个平台,点击数个关键词,便可生成一部长篇小说。
南方周末记者在“灵咔灵咔”网站上随机点取“无敌流”“学神”“疯批”“百合”“架空”“都市”等关键词,没有修改小说简介、剧情动力、人物角色等任何设定,“创作”了一篇名为《都域纪元之正义光》的网文,长达100章,每一章近3000字,整体过程耗时不超过2分钟。
这部网文语言稍显粗糙,也出现了部分内容冗余、习惯在每章末尾进行总结等AI创作的常见问题,但是通篇人物称谓基本稳定、逻辑链条成立,穿插着人物之间的对白、心理和动作细节描写,乍一看并没有AI网文曾被饱受质疑的“机器人味”。
中国社会科学院文学研究所发布的《2023年中国网络文学发展研究报告》显示,2023年,网络文学作者规模达2405万,作品数量达3620万部,用户数量达5.37亿,用户同比增长9%。就规模而言,中国网络文学产业正在突飞猛进地发展。
网络文学也是最早拥抱AIGC(生成式人工智能)的文学门类之一。近年来,多个网络小说平台开发了AI写作智能体,网络上也有许多教人用AI写作网文的课程。早在AIGC发展之前,就曾有博主在2021年用Excel制作了一个男频网文的生成器,其中除了人物、地点、世界观等基本信息,还包括了54个核心剧情“爽点”可以生成。
随着智能体的不断迭代升级,AI与人类创作的界限是否依旧清晰?
王峰团队用AI为《天命使徒》生成的人物图片。
逻辑漏洞,不够“人”味
上百万字的《天命使徒》讲了一个并不复杂的故事:一位青年修仙者,修行中在明暗两极徘徊,最终选择与爱人回归平凡日常生活,不再孤独求道。整个故事显得有些套路,是市面上常见的带有“玄幻”“修仙”“少年成长”标签的男频小说。
创作过程采用“大模型+提示词工程+人工后期润色”的方式完成。在阅读了市面上流行的网文后,王峰团队设定了剧情框架、人物角色,并借助大模型辅助生成提示词,再投给大模型生成文本,最后人工对文本进行润色。
王峰发现,保持文本的一致性是用大模型写长篇小说最难的部分。他和团队对市面上现有的各种大模型进行测试,发现如果依靠大模型自身的逻辑能力来生成小说,目前的写作篇幅极限是三万字。
这源于AI写作与人类写作的逻辑有着本质性的不同:人类写作是从头开始的线性写作,但AI是“模块化写作”,在给到一段基本的提示以后,同时开始各个部分的写作。这有点像是科幻电影《降临》里外星文明的写作方式,文字写在一个圆圈里,句子可以从圆圈的任何一处开始阅读。
这样的特性导致大模型在创作过程中经常会出现人类作家很少犯的逻辑错误,比如“故事进行了一半,主人公就已经被写死了,然后再到下一部分,他马上又活过来了”。
因此,不同于短篇网文的创作,完成一篇逻辑通顺的长篇小说需要大量的提示词。为了训练大模型处理海量提示词的能力,王峰团队一开始就将小说的目标字数设定在了一百万字。在输入一段提示词后,目前的大模型平均会生成500字的内容,因此,百万字网文的创作,需要至少2000条提示词。
提示词的好坏至关重要。首先,在内容上要告知大语言模型相对具体的情节逻辑,并且向它交代,希望它可以展开想象力,角色的成长很重要,剧情需要变化。“网文中会大量使用短句,多使用对话,对话要独立成段,这些我也要告诉它。”团队成员魏萱是“灵咔灵咔”的项目经理,曾在国内头部AI文本生成公司实习。
同时,提示词在风格上也要和期待生成的文本语言相匹配。“如果提示词比较具有表现力,那么它写的段落就会比较有表现力。如果想写清宫风格的小说,提示词的文风就不要太现代,用一些古色古香的内容,会更容易让模型理解到你想要的风格是什么。”魏萱告诉南方周末记者。
另一个效果较好的方法是与现有的文学风格进行类比,“比如你想要陀思妥耶夫斯基一样的风格,或者你想要迪士尼童话一样的风格”。《天命使徒》要求文字尽量直白、节奏快一些,更符合网文风格。
针对这些要求,不同模型实现的效果很不一样。王峰团队尝试了五种以上的大模型,发现有的擅长描绘细节,但框架不够完整;有的则逻辑性很好,但语言十分枯燥。王峰解释,这和大模型训练的语料库有关,比如后者可能用的是经济、法律合同,他们最后从中选用了两种。
真正拿到近1600页的《天命使徒》时,王峰非常震撼,“现在它写出的文本质量还不好,但整本书的逻辑是没问题的,”他对南方周末记者说,“从这一刻,我们可以开启人机协作时代了。”
相较于成熟的人类网文,《天命使徒》的语言确实不够有“人”味,行文中时不时夹杂着大模型的评点:“在这个场面中,每个人的情绪都鲜明而独特。”“在这个瞬间,他们的服从是勉强的,他们的矛盾是明显的,他们的权力博弈是激烈的。”
王峰发现,爱反思、爱总结是AI的一大特点。按照给定的提示词生成文本后,大模型通常会补充一段总结。比如在一段打斗描写后,兀自出现了一段总结,“他们彼此间的信赖关系在这危难之中显得尤为强烈,他们互相扶持,共同面对这突如其来的危机。”不同的AI总结的角度也有微妙的区别:国产大模型的总结比国外的大模型通常更乐观一些。
因此,大模型生成文本之后,人类作者额外要做的工作主要是删除。
《天命使徒》的创作在一个半月内就完成了。对于它的文学质量,王峰有着冷静的认知,他给这本小说打出的分数是61分。“按照我所看到的文学作品的层次,这是层次最低的小说。”他要求团队成员,坚决不要在后期进行过度润色,尽量呈现大模型生成的文本原貌。
当AI创作平台“灵咔灵咔”于2024年10月底推出时,王峰给它制作的10部小说打了70分,“大模型本身的发展非常之快”。
用AI生成长篇小说的平台“灵咔灵咔”计划于2025年年中投入大范围使用。
“让普通人也能写长篇小说”
在“灵咔灵咔”上,创作一部篇幅达到二三十万字的长篇小说只需几个步骤:在初始页面,点击标签或者输入文本来设定创作的网文类型,AI会生成小说的基础设定,涵盖简介、剧情动力以及主要角色。完成基础设定后,智能体便会继续生成章节大纲,最终生成完整正文。
比《天命使徒》的创作更进一步的是,这其中的每个步骤,都可以进行人工干预,或者让AI进行辅助优化。魏萱说,这让使用者从单纯的写作者变成了读者和编辑,使用者的文学素养与审美变得更加重要,“相当于是厨师做菜的时候,每次加盐都让你尝一下味道,一直调到你觉得合适为止”。
王峰曾在华东师范大学教授“大语言模型与创意写作”课程,布置的作业包括让同学写五万字的小说。交上来的小说文体不限,武侠、玄幻、同人都有,但他发现,写得比较好的都是人工干预的部分高,搭建的框架足够好,并进行了进一步的修订。“高质量的文本还是得有人工干预。对智能的理解,绝不是说我啥也不管,闭着眼睛扔给AI,AI都给我完成得好好的。”
在智能体的辅助下,写作变成了“人类给灵感框架、智能体写内容”。甚至,也可以由AI起草一个框架,使用者来修改。
与AI互动时,魏萱发现,AI生成的内容会给她带来启发,激励她的写作意愿。“比如我想在文章里面展现某一个元素,但是我觉得这个元素好像不太清晰,我就去问它,怎么展现比较好?它会给我提供大概四五个方案,我来选。”
目前,ChatGPT、Kimi等大模型也支持用户创建智能助手。魏萱曾创建过一个知心大姐姐角色的ChatGPT助手,给对方设定:“你是一个温柔可爱的知心大姐姐,你会用你丰富的人生经历给我的想法很多支持和关注,你会温柔地鼓励我。”设置后,魏萱输入“你好”,这位“知心大姐姐”回应“小萱萱,你好呀”,配有一个笑脸的emoji。
“写作不再是一个沉默、艰苦的工作。”魏萱对南方周末记者说。
从尝试用大模型创作长篇小说伊始,王峰的目标就是“让普通人也能写长篇小说”。在他看来,也许每个普通人都能想出一个故事,但真正付诸实践时,小说如何展开情节、如何描写冲突等,都需要想象力和意志力。
“虽然爱好文学的人那么多,但真正能写长篇的在人口当中可能达不到1%。但是有了智能体以后,我们能够让人口当中60%-70%的人走入这扇大门。我觉得这就是意义。”王峰对南方周末记者说。
在王峰看来,AI网络文学是人类通往智能文学的一座桥梁。智能化写作在至少五年内还看不到赶上人类作家的可能性,相比之下,网络文学剧情更模式化,语言表达更为浅显和直白,入门门槛较低,AI更有应用空间。
随着AI写作的发展,版权、抄袭、“洗稿”等问题也不断浮出水面。2024年7月,番茄小说平台要求作者签订“AI训练补充协议”,打算将作者的原创内容用作语料来训练AI,引发了部分签约作家的不满与抵制。在海外,许多AI生成的“垃圾书”在亚马逊网站上市,其中不乏误导信息并冠上错误作者,许多无辜作者因此“躺枪”。
王峰预测,未来的人工智能小说创作在数量上将变得极大丰富,随之而来的是“垃圾产品非常多”,遴选好作品的机制因此变得重要。与此同时,经典文学的创作并不会消失,但判断网络文学好坏的标准已经不同于主流文学,未来智能文学的遴选机制也一定不会相同。
“说不定目前智能文学被认为的枯燥乏味的特点,未来反而成为了某种标准,”王峰说,“人工智能的力量没有任何人可以预测,我只知道这个力量是极大的,很难阻挡。”
魏萱对AI写作有另一重顾虑,若不加以人工干预,大模型可能延续人类既有的歧视与刻板印象。魏萱实习时所在的公司曾开发一个对话体的大模型,她发现,这个AI说的话总是带着侮辱人的色彩,“它总是说‘你要跟我结婚,给我生孩子’。”
人工智能行业已经出现了如何促进“AI for good(人工智能向善)”的讨论,包括增加伦理的训练和标注,让大模型摆脱既有的偏见与歧视。目前,若非人为地要求,比较成熟的大模型已经不会“吐脏字”了。“但是一些套路和成见,比如总是要给男主角配一个美丽漂亮的女主角,你可能要明确地告诉它,才能让它改变。”魏萱说。