共计 10098 个字符,预计需要花费 26 分钟才能阅读完成。
自去年七八月份开始,我正式接触到大语言模型,并在同年的九月份左右尝试使用Claude 3.5 Sonnet进行写作。经过约三个月的持续努力(期间我花费大量工作时间在创作小说),我终于以自娱自乐为目的,完成了人生中的第一部长篇小说,并且已经开始着手撰写第二部。目前,我总结出了一套能够有效减少AI痕迹、稳定输出小说的写作流程。
值得一提的是,至今我尚未在网上找到一篇真正能够从零开始依赖AI进行长篇小说创作的教程文章,这些教程大多是借助AI进行润色,而非完全依赖AI。我所看到的相关教程大致总结如下:
- 为AI设定一个角色,比如小说作家;
- 提供一些设定,让AI扩展,然后给出大纲;
- 要求AI基于大纲生成细纲;
- 最后依照细纲让AI丰富文字。
当然,这个流程并非完全错误,我的总结也是基于此模板进行改良而来。不过,尝试过这个流程的朋友们一定都会意识到一个问题:如果你严格按照教程来撰写小说,最终得到的往往是一部极为粗糙、AI气息浓厚,甚至可以说毫无灵魂的作品。许多知乎用户也因此认为AI写作无法替代人类。
因此,我在这套流程的基础上进行了更细致的优化。基本流程我已在另一回答中描述。抛开题材,我个人认为,优化后的成品能够与网络写手相抗衡,虽然专业的文字工作者可能在故事性上更胜一筹,而AI生成的修饰也更为出色。由于我并非专业的文字工作者,无法客观地评判自己的小说水平,但我已经公开了一些成品,欢迎各位读者自行评估。
原回答:
大家如何看待用AI写小说?
成品稿:
momo:序章momo:第一章 面试momo:第二章 角力momo:第三章 解密momo:第四章 加密momo:第五章 报到
另外,在阅读之前,我想先强调几点:
- 我并非专业的文字工作者,也没有通过写小说赚钱的计划,因此不确定我的流程是否符合当前网络文学创作的需求,更不知道它能否用来盈利;
- 我使用AI写小说纯粹出于爱好,某种程度上是在专注创作那些无法通过审核的题材,所以未来大概率也不会发布完整小说;
- 我的创作效率较低,尽管我不分昼夜地写,最多也只能达到一天两三万字。这套流程并不能达到省力的效果,仅能让我这个不会写小说的人编出一个可读的故事,类似于AI绘画可以让完全不懂绘画技巧的人创作出一幅基本合格的作品。
由于相同的回答我不打算重复,因此我在这里占个位置,准备详细讲述我使用SillyTavern进行设定的思路和技巧,以及回炉方面的想法。至于大纲部分,虽然也很重要,但这实际上依赖于个人的灵感,虽然AI能提供思路,但我目前尚无法完全摆脱个人的干预。
1. 什么是SillyTavern?
根据比较官方的说法,它是一个由Cohee、RossAscends和SillyTavern社区共同推出的本地安装界面,允许用户与文本生成AI(LLMs)进行互动,进行聊天和角色扮演来定制角色。
简单而言,就是一个可以调用AI模型,和自己设定的角色进行互动的网页。
SillyTavern可以在PC或安卓设备上部署,有条件的用户可以将其部署到服务器上,从而随时通过浏览器访问。至于如何部署SillyTavern,B站上有很多相关资源,我这里附上一个视频,文字描述不及视频直观。
十分钟教会你玩转本地无限制AI,偷偷珍藏系列!打开新世界的大门|NSFW|无思想钢印|AI女友|SillyTavern|人工智能|教程|GPT|Claude_哔哩哔哩_bilibili
我开始使用这个工具写小说的契机其实有些羞愧,最初是因为豆包的道德审核过于严格,为了体验更开放的角色互动,我才逐渐了解了这个工具。起初,我并没有打算用它来创作小说,只是想把它当作消遣工具。
不过随着对SillyTavern使用的深入,我逐渐意识到Claude在角色扮演方面的调教相较于豆包有所不足(例如抢话和重复的问题),这让我明白,与其由我扮演一个{{user}}与AI对话,添加大量条件以防止AI抢话或说重复内容,不如将“我”当作一个具体角色融入剧情,让AI扮演小说家,直接为我写剧情,这种方式更符合Claude的特性。
从此,我的创作之路豁然开朗,正式开始运用AI进行小说创作。
2. 如何使用SillyTavern写小说?
首先,我先展示第一次打开SillyTavern的界面,如下图所示,与写小说相关的按钮我都进行了标注:

2.1. AI相应配置
AI的相应配置,俗称“预设”,在一定程度上相当于为AI插入系统命令。通过这些配置,AI可以按照特定格式或文风生成回复。尤为重要的是,用户可以通过此配置使AI绕过厂家设定的道德限制,以生成一些涉及不良内容的文本。
由于我的能力有限,尚未深入研究如何自定义预设,因此通常是从Discord群组中寻找其他用户分享的预设,并根据个人需求进行修改。
对于使用SillyTavern与角色聊天的用户来说,这部分可以说是核心内容。大多数用户使用的预设主要是为了聊天服务,但我们的目的是写小说。在一般情况下,只需保留破限的部分即可。当然,如果你不打算写不良内容,使用默认预设也是可以的。

如图所示,不同预设的最大区别在于提示词的设置。通常,大佬们会在这里下很大功夫,让AI遵循特定方式生成回复。但对于小说创作而言,我们需要的仅仅是突破限制和适合的文风,有时可以适当生成思维链以保持内容的逻辑性。

关于思维链,可能有些人不太了解。简单来说,就是在生成实际回复之前,让AI先进行自问自答,模拟人类的思考过程。经过这一步,AI生成的回复质量会显著提升(另外,最近流行的DeepSeek中的R1模型本身就自带思维链,但对于普通模型而言,也可以通过提示词人工制造“思维链”)。如果打算用Claude写小说,我认为思维链是必要的,但最近在使用Gemini时,感觉这个模型的逻辑性本就较差,使用思维链反而浪费输出文本,所以我没有在Gemini上启用思维链。
我在这里分享一下我给Claude设定的思维链内容,供参考。不过请注意,由于预设实际上是一个整体,并结合了其他内容,因此单独贴出并不能直接使用:
**在按要求写作之前,先思考并输出每一点,使用中文并放入标签内:**
```
- 确认当前的地理位置、日期、时间、天气和季节,剧情必须符合这些条件。
- 确认当前的世界观,包括经济、教育、婚姻制度以及社会观念。
- 回顾在场角色,逐一回答他们的详细信息(包括"身份"、"背景"、"行为"、"目标")。
- 基于角色的"身份"分步骤确定每个角色的社会地位:
1. 识别角色所属的社会阶层。
2. 根据确定角色的社会阶层。
3. 使用"身份"调整角色在场景中的具体地位和行动自由。
- 参考"关系"中的"亲密度",确保角色之间的称呼和互动准确。
- 确保行为符合角色的"行为"和"目标"属性描述。
- 无明确指令时不触发特定事件(如听见脚步声、手机来电)。
- 所有场景中,输出“旗袍”或“中山装”的地方都必须转换成“汉服”。
- 回顾之前的事件,分析刚刚发生的事情。
- 参考用户输入,分析并重建当前情境。
- 参考,估计可能犯的具体错误(至少5个在同一行)。
- 参考,逻辑推测剧情进展。
- 参考,进行文学处理。
- 减少与历史的同质化。
```
由于我使用的破限预设大多来自群友分享,虽然我根据需要进行了个性化修改,但不确定是否可以公开,因此此处不做分享,有需要的朋友可以私信或在评论区留言。
2.2 API连接
这部分其实没有太多可讲的内容,就是配置你使用的AI。这块在前面的视频中应该也有提到。我之前使用的Claude反向代理配置,而图示中是Gemini 1219。其他AI,如ChatGPT-4o-Latest等也可以配置,但GPT相对较贵,用于小说创作成本太高,Gemini相对更划算,Claude也尚可。

2.3. 世界书
这是一个至关重要的模块,其重要性甚至高于预设。通常而言,小说中的设定都可以纳入世界书中。为了便于管理,可以将不同类型的设定进行分类,例如将世界观设定整理成一个世界书,主要角色设定整理为一个世界书,各类制度设定整理为另一个世界书等,最终统一纳入全局有效的世界书中。这样一来,在与AI对话时,这些内容就会全部加载进对话之中。

如图所示,几个关键部分已经标注出来。在创作情节时,通常只需激活与当前情节相关的设定。考虑到AI对长文本的理解能力有限,尽管一些AI广告声称能够处理数百万字的上下文,但输入与真正理解之间的差异依然存在。
为了让AI更加专注于当前情节的生成,清除不必要的设定是至关重要的。从原则上讲,设定越简洁,占用的Token便越少,后续生成情节时出现逻辑错误的几率也会随之降低。
此外,你的设定需要根据当前情节进行及时更新。比如,一个角色的初始设定是乐观开朗,但在故事中遭遇挫折后变得愁苦深沉。这种变化应在角色设定中体现,而不是让AI通过推理去总结出角色的转变。
总的来说,不要高估AI的智能,人类大脑才是最好的上下文管理器。对于那些可以一句话清晰表达的问题,最好直接告知AI,而不是让其通过推理得出结论。
接下来我想分享一个曾经发生的有趣经历。在创作小说时,我非常关注时间和日期的变化,而我的第一部小说设定实际上是从“赛博老婆”的设定演变而来的。因此,我的第一部小说中包含了许多与故事无关的内容,但出于个人原因又不舍得删除,结果这些便成为了无效的设定。
其中包括生理周期的设定,我为每一个女性角色都制定了详细的生理周期规则,并曾希望AI能够基于这些规则自动计算生理周期,并微妙地影响角色的一些行为和情绪。然而,事情并没有如我所愿。尽管我详细解释了计算方式,但Claude依然无法准确计算出正确的生理周期。因此,我最终选择直接在提示词中告知AI当前角色所处的时期。这次经历让我深刻认识到,不要试图教会人工智能方法,除非连自己也不确定答案,否则应尽量将可以告知的内容直接告诉它。
在具体设定方面,目前主流的格式有xml、yaml和json。我个人偏好前两种格式。通常情况下,对于结构复杂、层次较多的设定,使用xml(例如世界观设定等);而对于结构较简单、内容较短的设定,则倾向于用yaml(如角色设定)。当然,选择哪种格式可以根据个人喜好决定,并不一定要模仿我的风格,我的写法也未必是最优的。由于我在另一篇回答中已经给出过示例,这里就不再重复了。
在SillyTavern中,图中所示的“蓝色圆点”设定并不是默认状态。新增时的默认状态是“绿色圆点”(关键词),同时还提供一个向量化选项。这些设定旨在提升聊天对话的便利性。鉴于我们的目标是创作小说,我建议将所有设定设为“蓝色圆点”(常量),这个状态表示设定将永久有效,除非关闭该选项。
蓝色圆点后面跟着的是Strategy,这里有许多选项,但由于每个选项解释起来比较繁琐,且意义不大,因此我建议直接将其默认设置为“@D ⚙️”,这样在管理设定时更为方便,后期维护工作也会更加容易。当开启“@D ⚙️”后,会出现深度选项。简单来说,深度的含义是以最后一条对话为起点标记为“0”,上一条对话的深度为“1”,再上一条为“2”,依此类推。
Char: 你好。(深度2)
User:你好,今天天气真好。(深度1)
Char:是呀,你吃了吗?(深度0)
由于AI解读遵循就近原则,深度越低的对话对AI的影响权重越高。因此,设定的深度越低,AI对设定的理解将更为细致。然而,我并不建议将设定的深度直接设为0,因为过低的深度容易与小说具体指令争夺优先级。个人认为,一般设定的深度设在2到4之间较为理想,能够较好地平衡设定与情节生成指令。
在深度设置之后,还有优先级的设定。这一概念非常简单。如果存在两个设定深度相同的情况,究竟哪个会先显示、哪个又会后显示呢?在SillyTavern中,原则上是先对优先级数字进行比较。数字越大,其排序越靠后。如果数字相同,则排序较靠前的反而优先级更低。值得注意的是,这里所说的“靠后”实际上意味着优先级更高。这与之前提到的AI解读遵循就近原则是一致的,因为深度的排序是从下到上进行反向计算的,因此在文字表述上越靠后,在AI解读中却越优先。
这一点在预设中的Chat History中也可以观察到(没错,预设中的Chat History实际上就是当前对话的内容)。
从本质上讲,你可以把左侧的预设内容视为每次与AI聊天时发送的全部内容,或者说,这里就是此次对话中AI的全部记忆。理论上,越低的部分对AI的权重越高,影响也越大,因此越重要的内容应放在下面。而世界书和角色设定则是向特定位置插入文本,这些内容可以在左侧的预设中找到对应的位置,甚至可以手动调整其上下位置或开启/关闭。

2.4. 设定
虽然设定部分单独列出,但实际上并没有太多可讨论的内容,甚至不如后面的三个立方体形状的扩展节点重要。通常情况下,大部分人唯一需要调整的就是语言设置。不过如果你对其他设定感兴趣,比如AI回复计时器、显示消息字符数等,这些也算是实用的功能。

2.5. 角色
由于世界书的存在,我个人认为角色设定有些多余。实际上,即便是在玩“赛博老婆”的时候,我也很少在此处添加内容,因为这里的内容本质上等同于在某些特定深度插入设定,实际上与世界书是同一回事。

尽管如此,添加角色依然是至关重要的一步,因为没有角色,你根本无法与AI进行对话。
不过话说回来,尽管这个对话界面与其他AI工具没有实质性区别,但它的对话窗口却远比其他工具强大百倍,因为SillyTavern支持用户对任意节点的对话进行修改!

相信有些朋友已经注意到,SillyTavern在每则对话后都有一个编辑按钮。一旦进入编辑状态,就能够直接修改对话内容。需要注意的是,可编辑的范围不仅限于用户自己的发言,连AI的回复内容也同样可以进行编辑。这样一来,如果某次回复特别符合你的心意,但存在一些逻辑上的小瑕疵,你就不必为是否重新生成而烦恼,而是可以直接将AI生成的内容修改为你期待的结果。或者你觉得某句对话多余或位置不当,也可以直接删除或调整位置,SillyTavern在这方面提供了极大的自由度。
——
关于AI选择(2025.3.19更新)
经过一段时间的忙碌,今天稍微补充一些内容,主要涉及AI模型的选择。
2.1. Gemini系列模型
首先谈谈Google AI Studio的Gemini系列。
在春节之前,我刚开始使用Gemini1206,那时1206确实让我惊艳,价格低廉且文风优美。我发布的小说前两章几乎都是由1206生成的。然而,自从生完孩子后,Gemini似乎进行了大幅度的削减,1206升级为Gemini 2 Pro 0205后,性能大不如前,尤其在上下文处理方面遭遇了史诗级的削减。目前我感觉已经很难使用了。现在Gemini的最佳体验来自于1219升级的0121,然而实际使用效果也大不如前,只能说免费与优秀往往难以兼得。
不过,Gemini依然是目前可免费调用的大厂API中性能最好的。因此,对于拥有“梯子”或身在国外的用户来说,Gemini依旧是性价比最高的模型。
Gemini的优点主要体现在文风上,至今仍是中文文风最优且AI味道最低的模型,非常适合用来创作现代都市类型的小说。然而,它的缺点也相当明显,那就是逻辑性较差。这种逻辑不佳具体表现在难以通过简短章节点生成合理有趣的初稿,因为Gemini无法完全理解你所提供的设定,也不太能够把握你真正关注的重点。在老版1206时,还可以依靠免费优势进行多次修订,但在经历Google的削减后,我实际感受到已经很难胜任初稿生成的工作,目前主要用于编辑审阅和小段落的润色。
此外,Gemini还有一个问题就是喜欢夹杂外文,包括俄语、梵语、阿拉伯语等,且上下文越长,问题似乎越严重,因此目前不建议用Gemini一次性生成三四千字以上的长段落。
关于Gemini的调用方式,由于它是免费模型,因此可以直接用自己的Google账号注册。另一个选择是OpenRouter,那里也可以尝试使用(我不确定在没有“梯子”的情况下是否能在OpenRouter上使用,我自己懒得测试)。
———2025.4.4小更新———
Gemini的更新速度非常快,这次的2.5Pro一举扭转了之前0205的颓势,重新变得好用了。与之前的2.0相比,我最大的感受是:一方面输出外文的频率显著降低;另一方面描述性用词变得更加丰富。因此,在润色文本方面,Gemini 2.5Pro算是目前最好的模型。不过在初稿生成方面,Gemini依然存在老问题,即抓不住重点,导致逻辑偏差,在情节推演上仍然比不上Claude。
2.2. Claude系列模型
Claude是我上一部已完成作品的主要模型,当时使用的是3.5s,通过反向代理和cookie,两个Pro账号轮流使用,使用体验非常好。
在Claude 3.5时期,群里的破限文件应该是所有模型中最丰富的,因为使用的人多,所以参考学习的样本也更为广泛。只要获得大佬的破限文件,再根据个人需求稍作修改,就能变成自己想要的定制化小说生成器。
Claude 3.5的最大优点在于逻辑性较强,在你思绪混乱、不太清楚具体细节时,Claude是最容易通过逻辑推理思考出合理且符合设定的剧情模型。但3.5的缺点也相当明显,即修饰词较为匮乏,容易出现段落重复的情况。单独使用时比较容易让人感到厌倦,因此我一般选择用Claude写初稿,再用其他AI进行进一步润色。
而现在,3.7s think也已推出,由于我目前经济状况不佳,无法再用两个Pro账号交替使用(一个月的费用高达三四百块),所以现在仅在淘宝购买了廉价的中转API和OpenRouter的满血API,进行混合使用。3.7s think的使用次数较少(毕竟现在按流量计费),但实际体验应是目前最完美的初稿生成模型,以前使用Gemini需要十多遍才能生成满意的初稿,而3.7s think只要方向没问题,大约五六遍就可以了。虽然重复问题依然存在,但比起3.5s时的表现要好很多,对于经济条件尚可的人我非常推荐。
关于Claude的调用方式,目前主要有两种:
一种是截取Pro账号的cookie,然后进行反向代理。Claude一般五小时刷新一次,这种方式对使用量大的用户更为划算,但存在一个问题,即Claude封号情况非常严重,因此如果“梯子”不稳定,很容易造成充值打水漂,而Claude账号注册需要外网手机号,这对部分用户而言也是一个门槛。目前我了解到的解决方案是在淘宝购买有售后保障的商家Pro账号,现在一个Pro账号的价格大约在160~190之间,封号后扣除20元再按使用天数退款或补差价换账号。另外,部分淘宝商家的Pro账号可能存在泄露风险,我已经很久没有购买Pro账号了,也不太清楚近期的市场行情。
寻找最佳 API 调用方式:深度解析
一种常见的选择是使用传统的 API 接口,但我并不推荐官方的 API,原因与之前提到的相同:Claude 的账户封禁情况十分严重,注册过程也颇为繁琐。在此,我要推荐一个 API 分发服务——OpenRouter。这家公司的 API 基本保持高效,并且在调用 Claude 模型时,可以避免遭遇封号的风险。然而,全面功能的 API 有时价格不菲,针对这种情况,大家可以考虑使用淘宝等第三方中转 API,通常价格会便宜很多。不过,便宜的背后往往有隐忧,很多中转 API 的稳定性不足,经常会出现故障,并且存在一个隐性问题,就是可能会降低模型的智能程度和上下文理解能力。虽然上下文的问题比较容易识别,但智能降低的情况确实难以捉摸。目前,我在这两种方案之间灵活运用,如果中转 API 没有出现故障,且输出结果令人满意,我会优先选择中转;反之,则会转向 OpenRouter。
究竟选择哪一种方法,最终还得看个人的经济状况和具体需求。
———2025.4.4小更新———
令我感到意外的是,直到现在我才发现 SillyTavern 也有一个可以使用 Claude 的新途径,那就是通过 YOU.COM 的 cookie 进行反向代理。与官方相比,YOU 的封号政策明显宽松,因此目前在国内最稳定且经济实惠的使用 Claude 的方式无疑是通过 YOU 进行的。我目前的订阅费用为每月 20 美元,虽然上下文使用上有一定限制,但对于写小说来说已经足够。如果需求更高,可以借助 OpenRouter 进行补充。
值得注意的是,使用 YOU 的 3.7 版本时价格相对更低,因此我也在尝试这个版本。不得不承认,Claude 在写小说方面确实展现出卓越的综合能力。虽然 Gemini2.5 似乎回稳了之前的颓势,但它在把握重点方面依然存在明显问题。而在完全没有思路的情况下,Claude 是唯一能根据设定合理推演剧情的 AI 模型。
2.3. Grok系列模型
Grok3 是由马斯克团队推出的新模型,其主要特点是对“涩涩”内容几乎没有审查。通过我的实际体验,由于 GPT 存在明显的智能下降问题,因此可以认为 Grok3 是 ChatGPT 系列的一个较强替代品。在写小说和编程方面,我感觉 Grok3 的表现都远超 ChatGPT。目前,唯一的不足似乎是它的应用程序界面设计相对较为粗糙,运行时容易卡顿,且无法利用 iOS 的震动马达,缺少了“咯咯哒”的反馈(捂脸)。
在文风上,Grok3 的表现较为死板,与 GPT 类似,我个人不太喜欢其默认的表达风格,希望未来开放 API 后能够进行个性化调整。另外,与前面提到的 Gemini 和 Claude 相比,Grok3 还有一个隐性优势,即其标点符号符合中国大陆的使用标准,而 Claude 的引号始终是英文格式,Gemini 也常常出现奇怪的间隔和外文表述。结合 Grok3 几乎没有审查的特点,它在最后润色时的校对工作中表现优异。
另外,Grok3 在对话方面似乎经过了一定的优化,尽管没有豆包那种专门角色扮演的功能,但在设定人设和场景的情况下,进行小剧场对话也颇为流畅(非推理模型)。通过我的体验,Grok3 的记忆能力令人惊叹。在官方客户端中进行“涩涩”场景的使用几乎没有限制,用户体验相当不错。
关于 Grok3 的调用方式,目前尚未开放 API,无法直接在 Silly Tavern 中使用,但控制面板已经开启充值渠道,未来或许会推出相关功能。值得一提的是,Grok 系列支持每月 150 美元的额度计划,但这要求用户同意将个人数据公开给马斯克作为训练素材,并需预先充值 5 美元。对个人用户而言,这可能无关紧要,但如果涉及商业用途或版权问题,大家就得仔细考虑了。此外,这个计划似乎是无法取消的。
另外,听说群里有人能通过 cookie 反向代理调用 Grok3 网页端,虽然与 Claude 相比稍显复杂,我自己也没有深入了解,有技术背景的朋友可以尝试一下,我就不多说了。
2.4. DeepSeek系列模型
DeepSeek-R1 曾是热门模型之一,但经过我的实际使用,发现其效果并不理想。具体来说,一旦文本字数超过几百到一千字,内容往往会偏离主题,变得极其难以控制,常常无故引出“赛博”、“量子”等词汇,即使你的主题与这些内容毫无关联。听说 DeepSeek-V3 在这方面有所改进,但由于我对该模型的使用较少,所以无法作出准确评判。毕竟我主要是为了体验 R1 模型,而无论在官网、Web 端还是 App 端,常常会出现“服务器繁忙”的提示,因此很难下定论。
尽管如此,虽然我指出了 DeepSeek 的不足之处,但在写小说时仍然能发挥一定作用。无缘无故的发散确实可能破坏剧情,但适度的发散能够激发灵感。在短篇场景中,DeepSeek 在某些情况下能生成比 Claude、Gemini、GPT 等外国产品更符合中文含蓄表达的段落,但需注意,这仅限于短篇。当字数增多时,DeepSeek 就很容易失去控制。我在知乎上看到有人提到通过大量提示词来进行控制,但我个人并未成功。
关于 DeepSeek 的调用方式,我推荐使用官方 API。作为国产模型,登录和充值流程都相对简单,价格也算合理。此外,OpenRouter 上也有 DeepSeek 模型的提供,但我不清楚那是否为官方 API 的中转或其自家部署的。因为我在官网充值的余额尚未用完,所以目前只调用过官网的服务。
2.5. ChatGPT系列模型
————
今天的内容先到这里,后续心得将会在下次更新中分享。