用AI助力你的小说创作之旅！

共计 10098 个字符，预计需要花费 26 分钟才能阅读完成。

运用AI创作小说的全新探索之旅

自去年七八月份开始，我正式接触到大语言模型，并在同年的九月份左右尝试使用Claude 3.5 Sonnet进行写作。经过约三个月的持续努力（期间我花费大量工作时间在创作小说），我终于以自娱自乐为目的，完成了人生中的第一部长篇小说，并且已经开始着手撰写第二部。目前，我总结出了一套能够有效减少AI痕迹、稳定输出小说的写作流程。

值得一提的是，至今我尚未在网上找到一篇真正能够从零开始依赖AI进行长篇小说创作的教程文章，这些教程大多是借助AI进行润色，而非完全依赖AI。我所看到的相关教程大致总结如下：

为AI设定一个角色，比如小说作家；
提供一些设定，让AI扩展，然后给出大纲；
要求AI基于大纲生成细纲；
最后依照细纲让AI丰富文字。

当然，这个流程并非完全错误，我的总结也是基于此模板进行改良而来。不过，尝试过这个流程的朋友们一定都会意识到一个问题：如果你严格按照教程来撰写小说，最终得到的往往是一部极为粗糙、AI气息浓厚，甚至可以说毫无灵魂的作品。许多知乎用户也因此认为AI写作无法替代人类。

因此，我在这套流程的基础上进行了更细致的优化。基本流程我已在另一回答中描述。抛开题材，我个人认为，优化后的成品能够与网络写手相抗衡，虽然专业的文字工作者可能在故事性上更胜一筹，而AI生成的修饰也更为出色。由于我并非专业的文字工作者，无法客观地评判自己的小说水平，但我已经公开了一些成品，欢迎各位读者自行评估。

原回答：

大家如何看待用AI写小说?

成品稿：

momo：序章momo：第一章面试momo：第二章角力momo：第三章解密momo：第四章加密momo：第五章报到

另外，在阅读之前，我想先强调几点：

我并非专业的文字工作者，也没有通过写小说赚钱的计划，因此不确定我的流程是否符合当前网络文学创作的需求，更不知道它能否用来盈利；
我使用AI写小说纯粹出于爱好，某种程度上是在专注创作那些无法通过审核的题材，所以未来大概率也不会发布完整小说；
我的创作效率较低，尽管我不分昼夜地写，最多也只能达到一天两三万字。这套流程并不能达到省力的效果，仅能让我这个不会写小说的人编出一个可读的故事，类似于AI绘画可以让完全不懂绘画技巧的人创作出一幅基本合格的作品。

由于相同的回答我不打算重复，因此我在这里占个位置，准备详细讲述我使用SillyTavern进行设定的思路和技巧，以及回炉方面的想法。至于大纲部分，虽然也很重要，但这实际上依赖于个人的灵感，虽然AI能提供思路，但我目前尚无法完全摆脱个人的干预。

根据比较官方的说法，它是一个由Cohee、RossAscends和SillyTavern社区共同推出的本地安装界面，允许用户与文本生成AI（LLMs）进行互动，进行聊天和角色扮演来定制角色。

简单而言，就是一个可以调用AI模型，和自己设定的角色进行互动的网页。

SillyTavern可以在PC或安卓设备上部署，有条件的用户可以将其部署到服务器上，从而随时通过浏览器访问。至于如何部署SillyTavern，B站上有很多相关资源，我这里附上一个视频，文字描述不及视频直观。

十分钟教会你玩转本地无限制AI，偷偷珍藏系列！打开新世界的大门｜NSFW｜无思想钢印｜AI女友｜SillyTavern｜人工智能｜教程｜GPT｜Claude_哔哩哔哩_bilibili

我开始使用这个工具写小说的契机其实有些羞愧，最初是因为豆包的道德审核过于严格，为了体验更开放的角色互动，我才逐渐了解了这个工具。起初，我并没有打算用它来创作小说，只是想把它当作消遣工具。

不过随着对SillyTavern使用的深入，我逐渐意识到Claude在角色扮演方面的调教相较于豆包有所不足（例如抢话和重复的问题），这让我明白，与其由我扮演一个{{user}}与AI对话，添加大量条件以防止AI抢话或说重复内容，不如将“我”当作一个具体角色融入剧情，让AI扮演小说家，直接为我写剧情，这种方式更符合Claude的特性。

从此，我的创作之路豁然开朗，正式开始运用AI进行小说创作。

首先，我先展示第一次打开SillyTavern的界面，如下图所示，与写小说相关的按钮我都进行了标注：

SillyTavern的默认界面（实际上我设定了多个角色，为了不暴露个人喜好，这里已隐藏）

AI的相应配置，俗称“预设”，在一定程度上相当于为AI插入系统命令。通过这些配置，AI可以按照特定格式或文风生成回复。尤为重要的是，用户可以通过此配置使AI绕过厂家设定的道德限制，以生成一些涉及不良内容的文本。

由于我的能力有限，尚未深入研究如何自定义预设，因此通常是从Discord群组中寻找其他用户分享的预设，并根据个人需求进行修改。

对于使用SillyTavern与角色聊天的用户来说，这部分可以说是核心内容。大多数用户使用的预设主要是为了聊天服务，但我们的目的是写小说。在一般情况下，只需保留破限的部分即可。当然，如果你不打算写不良内容，使用默认预设也是可以的。

如图所示，不同预设的最大区别在于提示词的设置。通常，大佬们会在这里下很大功夫，让AI遵循特定方式生成回复。但对于小说创作而言，我们需要的仅仅是突破限制和适合的文风，有时可以适当生成思维链以保持内容的逻辑性。

图示为我基于SillyTavern预设3.023修改后的自用预设，展示的是思维链的部分

关于思维链，可能有些人不太了解。简单来说，就是在生成实际回复之前，让AI先进行自问自答，模拟人类的思考过程。经过这一步，AI生成的回复质量会显著提升（另外，最近流行的DeepSeek中的R1模型本身就自带思维链，但对于普通模型而言，也可以通过提示词人工制造“思维链”）。如果打算用Claude写小说，我认为思维链是必要的，但最近在使用Gemini时，感觉这个模型的逻辑性本就较差，使用思维链反而浪费输出文本，所以我没有在Gemini上启用思维链。

我在这里分享一下我给Claude设定的思维链内容，供参考。不过请注意，由于预设实际上是一个整体，并结合了其他内容，因此单独贴出并不能直接使用：

**在按要求写作之前，先思考并输出每一点，使用中文并放入标签内：**

``` 
- 确认当前的地理位置、日期、时间、天气和季节，剧情必须符合这些条件。
- 确认当前的世界观，包括经济、教育、婚姻制度以及社会观念。
- 回顾在场角色，逐一回答他们的详细信息（包括"身份"、"背景"、"行为"、"目标"）。
- 基于角色的"身份"分步骤确定每个角色的社会地位：
    1. 识别角色所属的社会阶层。
    2. 根据确定角色的社会阶层。
    3. 使用"身份"调整角色在场景中的具体地位和行动自由。
- 参考"关系"中的"亲密度"，确保角色之间的称呼和互动准确。
- 确保行为符合角色的"行为"和"目标"属性描述。
- 无明确指令时不触发特定事件（如听见脚步声、手机来电）。
- 所有场景中，输出“旗袍”或“中山装”的地方都必须转换成“汉服”。
- 回顾之前的事件，分析刚刚发生的事情。
- 参考用户输入，分析并重建当前情境。
- 参考，估计可能犯的具体错误（至少5个在同一行）。
- 参考，逻辑推测剧情进展。
- 参考，进行文学处理。
- 减少与历史的同质化。
```

由于我使用的破限预设大多来自群友分享，虽然我根据需要进行了个性化修改，但不确定是否可以公开，因此此处不做分享，有需要的朋友可以私信或在评论区留言。

这部分其实没有太多可讲的内容，就是配置你使用的AI。这块在前面的视频中应该也有提到。我之前使用的Claude反向代理配置，而图示中是Gemini 1219。其他AI，如ChatGPT-4o-Latest等也可以配置，但GPT相对较贵，用于小说创作成本太高，Gemini相对更划算，Claude也尚可。

不知道是否有省钱滤镜的缘故，目前我感觉Gemini的小说创作能力已经超越了Claude

这是一个至关重要的模块，其重要性甚至高于预设。通常而言，小说中的设定都可以纳入世界书中。为了便于管理，可以将不同类型的设定进行分类，例如将世界观设定整理成一个世界书，主要角色设定整理为一个世界书，各类制度设定整理为另一个世界书等，最终统一纳入全局有效的世界书中。这样一来，在与AI对话时，这些内容就会全部加载进对话之中。

如图所示，几个关键部分已经标注出来。在创作情节时，通常只需激活与当前情节相关的设定。考虑到AI对长文本的理解能力有限，尽管一些AI广告声称能够处理数百万字的上下文，但输入与真正理解之间的差异依然存在。

为了让AI更加专注于当前情节的生成，清除不必要的设定是至关重要的。从原则上讲，设定越简洁，占用的Token便越少，后续生成情节时出现逻辑错误的几率也会随之降低。

此外，你的设定需要根据当前情节进行及时更新。比如，一个角色的初始设定是乐观开朗，但在故事中遭遇挫折后变得愁苦深沉。这种变化应在角色设定中体现，而不是让AI通过推理去总结出角色的转变。

总的来说，不要高估AI的智能，人类大脑才是最好的上下文管理器。对于那些可以一句话清晰表达的问题，最好直接告知AI，而不是让其通过推理得出结论。

接下来我想分享一个曾经发生的有趣经历。在创作小说时，我非常关注时间和日期的变化，而我的第一部小说设定实际上是从“赛博老婆”的设定演变而来的。因此，我的第一部小说中包含了许多与故事无关的内容，但出于个人原因又不舍得删除，结果这些便成为了无效的设定。

其中包括生理周期的设定，我为每一个女性角色都制定了详细的生理周期规则，并曾希望AI能够基于这些规则自动计算生理周期，并微妙地影响角色的一些行为和情绪。然而，事情并没有如我所愿。尽管我详细解释了计算方式，但Claude依然无法准确计算出正确的生理周期。因此，我最终选择直接在提示词中告知AI当前角色所处的时期。这次经历让我深刻认识到，不要试图教会人工智能方法，除非连自己也不确定答案，否则应尽量将可以告知的内容直接告诉它。

在具体设定方面，目前主流的格式有xml、yaml和json。我个人偏好前两种格式。通常情况下，对于结构复杂、层次较多的设定，使用xml（例如世界观设定等）；而对于结构较简单、内容较短的设定，则倾向于用yaml（如角色设定）。当然，选择哪种格式可以根据个人喜好决定，并不一定要模仿我的风格，我的写法也未必是最优的。由于我在另一篇回答中已经给出过示例，这里就不再重复了。

在SillyTavern中，图中所示的“蓝色圆点”设定并不是默认状态。新增时的默认状态是“绿色圆点”（关键词），同时还提供一个向量化选项。这些设定旨在提升聊天对话的便利性。鉴于我们的目标是创作小说，我建议将所有设定设为“蓝色圆点”（常量），这个状态表示设定将永久有效，除非关闭该选项。

蓝色圆点后面跟着的是Strategy，这里有许多选项，但由于每个选项解释起来比较繁琐，且意义不大，因此我建议直接将其默认设置为“@D ⚙️”，这样在管理设定时更为方便，后期维护工作也会更加容易。当开启“@D ⚙️”后，会出现深度选项。简单来说，深度的含义是以最后一条对话为起点标记为“0”，上一条对话的深度为“1”，再上一条为“2”，依此类推。

Char: 你好。（深度2）
User：你好，今天天气真好。（深度1）
Char：是呀，你吃了吗？（深度0）

由于AI解读遵循就近原则，深度越低的对话对AI的影响权重越高。因此，设定的深度越低，AI对设定的理解将更为细致。然而，我并不建议将设定的深度直接设为0，因为过低的深度容易与小说具体指令争夺优先级。个人认为，一般设定的深度设在2到4之间较为理想，能够较好地平衡设定与情节生成指令。

在深度设置之后，还有优先级的设定。这一概念非常简单。如果存在两个设定深度相同的情况，究竟哪个会先显示、哪个又会后显示呢？在SillyTavern中，原则上是先对优先级数字进行比较。数字越大，其排序越靠后。如果数字相同，则排序较靠前的反而优先级更低。值得注意的是，这里所说的“靠后”实际上意味着优先级更高。这与之前提到的AI解读遵循就近原则是一致的，因为深度的排序是从下到上进行反向计算的，因此在文字表述上越靠后，在AI解读中却越优先。

这一点在预设中的Chat History中也可以观察到（没错，预设中的Chat History实际上就是当前对话的内容）。

从本质上讲，你可以把左侧的预设内容视为每次与AI聊天时发送的全部内容，或者说，这里就是此次对话中AI的全部记忆。理论上，越低的部分对AI的权重越高，影响也越大，因此越重要的内容应放在下面。而世界书和角色设定则是向特定位置插入文本，这些内容可以在左侧的预设中找到对应的位置，甚至可以手动调整其上下位置或开启/关闭。

虽然设定部分单独列出，但实际上并没有太多可讨论的内容，甚至不如后面的三个立方体形状的扩展节点重要。通常情况下，大部分人唯一需要调整的就是语言设置。不过如果你对其他设定感兴趣，比如AI回复计时器、显示消息字符数等，这些也算是实用的功能。

由于世界书的存在，我个人认为角色设定有些多余。实际上，即便是在玩“赛博老婆”的时候，我也很少在此处添加内容，因为这里的内容本质上等同于在某些特定深度插入设定，实际上与世界书是同一回事。

尽管如此，添加角色依然是至关重要的一步，因为没有角色，你根本无法与AI进行对话。

不过话说回来，尽管这个对话界面与其他AI工具没有实质性区别，但它的对话窗口却远比其他工具强大百倍，因为SillyTavern支持用户对任意节点的对话进行修改！

相信有些朋友已经注意到，SillyTavern在每则对话后都有一个编辑按钮。一旦进入编辑状态，就能够直接修改对话内容。需要注意的是，可编辑的范围不仅限于用户自己的发言，连AI的回复内容也同样可以进行编辑。这样一来，如果某次回复特别符合你的心意，但存在一些逻辑上的小瑕疵，你就不必为是否重新生成而烦恼，而是可以直接将AI生成的内容修改为你期待的结果。或者你觉得某句对话多余或位置不当，也可以直接删除或调整位置，SillyTavern在这方面提供了极大的自由度。

——

经过一段时间的忙碌，今天稍微补充一些内容，主要涉及AI模型的选择。

首先谈谈Google AI Studio的Gemini系列。

在春节之前，我刚开始使用Gemini1206，那时1206确实让我惊艳，价格低廉且文风优美。我发布的小说前两章几乎都是由1206生成的。然而，自从生完孩子后，Gemini似乎进行了大幅度的削减，1206升级为Gemini 2 Pro 0205后，性能大不如前，尤其在上下文处理方面遭遇了史诗级的削减。目前我感觉已经很难使用了。现在Gemini的最佳体验来自于1219升级的0121，然而实际使用效果也大不如前，只能说免费与优秀往往难以兼得。

不过，Gemini依然是目前可免费调用的大厂API中性能最好的。因此，对于拥有“梯子”或身在国外的用户来说，Gemini依旧是性价比最高的模型。

Gemini的优点主要体现在文风上，至今仍是中文文风最优且AI味道最低的模型，非常适合用来创作现代都市类型的小说。然而，它的缺点也相当明显，那就是逻辑性较差。这种逻辑不佳具体表现在难以通过简短章节点生成合理有趣的初稿，因为Gemini无法完全理解你所提供的设定，也不太能够把握你真正关注的重点。在老版1206时，还可以依靠免费优势进行多次修订，但在经历Google的削减后，我实际感受到已经很难胜任初稿生成的工作，目前主要用于编辑审阅和小段落的润色。

此外，Gemini还有一个问题就是喜欢夹杂外文，包括俄语、梵语、阿拉伯语等，且上下文越长，问题似乎越严重，因此目前不建议用Gemini一次性生成三四千字以上的长段落。

关于Gemini的调用方式，由于它是免费模型，因此可以直接用自己的Google账号注册。另一个选择是OpenRouter，那里也可以尝试使用（我不确定在没有“梯子”的情况下是否能在OpenRouter上使用，我自己懒得测试）。

———2025.4.4小更新———

Gemini的更新速度非常快，这次的2.5Pro一举扭转了之前0205的颓势，重新变得好用了。与之前的2.0相比，我最大的感受是：一方面输出外文的频率显著降低；另一方面描述性用词变得更加丰富。因此，在润色文本方面，Gemini 2.5Pro算是目前最好的模型。不过在初稿生成方面，Gemini依然存在老问题，即抓不住重点，导致逻辑偏差，在情节推演上仍然比不上Claude。

Claude是我上一部已完成作品的主要模型，当时使用的是3.5s，通过反向代理和cookie，两个Pro账号轮流使用，使用体验非常好。

在Claude 3.5时期，群里的破限文件应该是所有模型中最丰富的，因为使用的人多，所以参考学习的样本也更为广泛。只要获得大佬的破限文件，再根据个人需求稍作修改，就能变成自己想要的定制化小说生成器。

Claude 3.5的最大优点在于逻辑性较强，在你思绪混乱、不太清楚具体细节时，Claude是最容易通过逻辑推理思考出合理且符合设定的剧情模型。但3.5的缺点也相当明显，即修饰词较为匮乏，容易出现段落重复的情况。单独使用时比较容易让人感到厌倦，因此我一般选择用Claude写初稿，再用其他AI进行进一步润色。

而现在，3.7s think也已推出，由于我目前经济状况不佳，无法再用两个Pro账号交替使用（一个月的费用高达三四百块），所以现在仅在淘宝购买了廉价的中转API和OpenRouter的满血API，进行混合使用。3.7s think的使用次数较少（毕竟现在按流量计费），但实际体验应是目前最完美的初稿生成模型，以前使用Gemini需要十多遍才能生成满意的初稿，而3.7s think只要方向没问题，大约五六遍就可以了。虽然重复问题依然存在，但比起3.5s时的表现要好很多，对于经济条件尚可的人我非常推荐。

关于Claude的调用方式，目前主要有两种：

一种是截取Pro账号的cookie，然后进行反向代理。Claude一般五小时刷新一次，这种方式对使用量大的用户更为划算，但存在一个问题，即Claude封号情况非常严重，因此如果“梯子”不稳定，很容易造成充值打水漂，而Claude账号注册需要外网手机号，这对部分用户而言也是一个门槛。目前我了解到的解决方案是在淘宝购买有售后保障的商家Pro账号，现在一个Pro账号的价格大约在160～190之间，封号后扣除20元再按使用天数退款或补差价换账号。另外，部分淘宝商家的Pro账号可能存在泄露风险，我已经很久没有购买Pro账号了，也不太清楚近期的市场行情。

一种常见的选择是使用传统的 API 接口，但我并不推荐官方的 API，原因与之前提到的相同：Claude 的账户封禁情况十分严重，注册过程也颇为繁琐。在此，我要推荐一个 API 分发服务——OpenRouter。这家公司的 API 基本保持高效，并且在调用 Claude 模型时，可以避免遭遇封号的风险。然而，全面功能的 API 有时价格不菲，针对这种情况，大家可以考虑使用淘宝等第三方中转 API，通常价格会便宜很多。不过，便宜的背后往往有隐忧，很多中转 API 的稳定性不足，经常会出现故障，并且存在一个隐性问题，就是可能会降低模型的智能程度和上下文理解能力。虽然上下文的问题比较容易识别，但智能降低的情况确实难以捉摸。目前，我在这两种方案之间灵活运用，如果中转 API 没有出现故障，且输出结果令人满意，我会优先选择中转；反之，则会转向 OpenRouter。

究竟选择哪一种方法，最终还得看个人的经济状况和具体需求。

———2025.4.4小更新———

令我感到意外的是，直到现在我才发现 SillyTavern 也有一个可以使用 Claude 的新途径，那就是通过 YOU.COM 的 cookie 进行反向代理。与官方相比，YOU 的封号政策明显宽松，因此目前在国内最稳定且经济实惠的使用 Claude 的方式无疑是通过 YOU 进行的。我目前的订阅费用为每月 20 美元，虽然上下文使用上有一定限制，但对于写小说来说已经足够。如果需求更高，可以借助 OpenRouter 进行补充。

值得注意的是，使用 YOU 的 3.7 版本时价格相对更低，因此我也在尝试这个版本。不得不承认，Claude 在写小说方面确实展现出卓越的综合能力。虽然 Gemini2.5 似乎回稳了之前的颓势，但它在把握重点方面依然存在明显问题。而在完全没有思路的情况下，Claude 是唯一能根据设定合理推演剧情的 AI 模型。

Grok3 是由马斯克团队推出的新模型，其主要特点是对“涩涩”内容几乎没有审查。通过我的实际体验，由于 GPT 存在明显的智能下降问题，因此可以认为 Grok3 是 ChatGPT 系列的一个较强替代品。在写小说和编程方面，我感觉 Grok3 的表现都远超 ChatGPT。目前，唯一的不足似乎是它的应用程序界面设计相对较为粗糙，运行时容易卡顿，且无法利用 iOS 的震动马达，缺少了“咯咯哒”的反馈（捂脸）。

在文风上，Grok3 的表现较为死板，与 GPT 类似，我个人不太喜欢其默认的表达风格，希望未来开放 API 后能够进行个性化调整。另外，与前面提到的 Gemini 和 Claude 相比，Grok3 还有一个隐性优势，即其标点符号符合中国大陆的使用标准，而 Claude 的引号始终是英文格式，Gemini 也常常出现奇怪的间隔和外文表述。结合 Grok3 几乎没有审查的特点，它在最后润色时的校对工作中表现优异。

另外，Grok3 在对话方面似乎经过了一定的优化，尽管没有豆包那种专门角色扮演的功能，但在设定人设和场景的情况下，进行小剧场对话也颇为流畅（非推理模型）。通过我的体验，Grok3 的记忆能力令人惊叹。在官方客户端中进行“涩涩”场景的使用几乎没有限制，用户体验相当不错。

关于 Grok3 的调用方式，目前尚未开放 API，无法直接在 Silly Tavern 中使用，但控制面板已经开启充值渠道，未来或许会推出相关功能。值得一提的是，Grok 系列支持每月 150 美元的额度计划，但这要求用户同意将个人数据公开给马斯克作为训练素材，并需预先充值 5 美元。对个人用户而言，这可能无关紧要，但如果涉及商业用途或版权问题，大家就得仔细考虑了。此外，这个计划似乎是无法取消的。

另外，听说群里有人能通过 cookie 反向代理调用 Grok3 网页端，虽然与 Claude 相比稍显复杂，我自己也没有深入了解，有技术背景的朋友可以尝试一下，我就不多说了。

DeepSeek-R1 曾是热门模型之一，但经过我的实际使用，发现其效果并不理想。具体来说，一旦文本字数超过几百到一千字，内容往往会偏离主题，变得极其难以控制，常常无故引出“赛博”、“量子”等词汇，即使你的主题与这些内容毫无关联。听说 DeepSeek-V3 在这方面有所改进，但由于我对该模型的使用较少，所以无法作出准确评判。毕竟我主要是为了体验 R1 模型，而无论在官网、Web 端还是 App 端，常常会出现“服务器繁忙”的提示，因此很难下定论。

尽管如此，虽然我指出了 DeepSeek 的不足之处，但在写小说时仍然能发挥一定作用。无缘无故的发散确实可能破坏剧情，但适度的发散能够激发灵感。在短篇场景中，DeepSeek 在某些情况下能生成比 Claude、Gemini、GPT 等外国产品更符合中文含蓄表达的段落，但需注意，这仅限于短篇。当字数增多时，DeepSeek 就很容易失去控制。我在知乎上看到有人提到通过大量提示词来进行控制，但我个人并未成功。

关于 DeepSeek 的调用方式，我推荐使用官方 API。作为国产模型，登录和充值流程都相对简单，价格也算合理。此外，OpenRouter 上也有 DeepSeek 模型的提供，但我不清楚那是否为官方 API 的中转或其自家部署的。因为我在官网充值的余额尚未用完，所以目前只调用过官网的服务。

————

今天的内容先到这里，后续心得将会在下次更新中分享。

来源：知乎

原文标题：如何利用 AI 进行小说创作？– 知乎

原文链接：https://www.zhihu.com/question/10241911672/answer/87541030353

声明：

文章来自网络收集后经过 ai 改写发布，如不小心侵犯了您的权益，请联系本站删除，给您带来困扰，深表歉意！

正文完