
SillyTavern轻松搭:各种技巧/插件的说明
由于原来的帖子太过臃肿,因此新开这个各类小技巧的说明,用以补充酒馆的使用过程中可能遇到的问题。未来会重新整理原贴的内容,让每个帖子都变得可读性更高。酒馆未来的更新也应该会在本帖子长期更新。
酒馆PC/NAS布置:点我
酒馆手机布置:点我
酒馆VPS服务器布置:点我
酒馆使用技巧合集:点我
目录:
1、如何更新角色卡
2、隐藏和总结,解决爆token和掉格式、注意力低等问题
3、酒馆助手(必装插件)
4、关于“出现英文/韩文/日文”等问题
5、增强消息提醒插件
1、如何更新角色卡
有时候原作者更新了角色卡,但是自己这张卡已经玩了很久,并不想删了重新跑,于是我们就需要对当前卡片进行更新。

首先我们点击角色卡,然后点击红框的“世界书”图标。

然后点击垃圾桶图标,删除世界书。

回到卡片,我们看到地球的图标从绿色变成白色,就代表删除成功了。

接着,点击更多,然后下拉菜单点击“替换/更新”

随后就是点击“是”,然后选择新版本的PNG格式图片导入,最后跟常规卡片导入一样,确认导入新的世界书。这样,这张卡的更新就成功了。
2、隐藏和总结,解决爆token和掉格式、注意力低等问题
(感谢群内Andy的测试和帮助!)
深入使用酒馆的朋友很可能会发现许多新问题的涌现,包括:
<1>爆Token:因为AI的前后文输入有总数限制,所以导致长期玩一张卡会出现爆Token无法继续游戏的情况。

<2>人物性格、故事矛盾:将人物A的故事套入人物B,或者前面故事明明发生过或者说好的事情,后面就忘光了。这同样是因为前后文能够输入的tokens有限而导致的。
<3>人物注意力不集中:明明故事发展到当前节点,但是故事发展的时候突然会回到稍早一些的故事情节中。多次刷新才会回到正轨。
<4>丢格式,各类COT格式经常丢,对于复杂的系统卡、手机卡、有UI之类的卡尤为严重
当前并没有完美解决这个问题的机制,随着故事的发展,这种情况会越来越明显(一般超过200层楼的时候会非常突出),我们只能尽可能找解决的方案。当前最佳的方案可能是:总结+隐藏。
2.1、总结
总结是指对前面发生的故事进行一次精炼的总结文字,尽可能降低输入tokens的数量,以延缓爆tokens的时间。总结的方法很多,有插件、也有QT(快速回复)、也有COT,都各自有利弊长短。BLOG主这里介绍的是一个全自动的基于插件实现的总结功能。打开这个(或者Github)酒馆插件,安装方式非常简单,根据上文插件安装方式,点击“安装扩展”,输入网站上提供的安装地址,稍等几十秒就可以自动安装完成。安装完成后,我们就会看到插件中多出“记忆增强(表格)”栏目,代表插件已经完成了安装。记住要勾选“插件启用”以及下面的两个AI读表、改表开关,以确保它正常工作。

随后,我们可以随时在游玩过程中,点击下图位置,打开当前记录的表格。注意,该表可能对已经开始的对话不起作用,如果需要使用表格,可能需要重新开始整个游戏。

另外需要注意的是,在表格的运作过程中,可能会出现记录错误(大概2%左右)或者直接无法记录(大概1%左右)的概率。遇到这种情况,需要手动对内容进行修改和调整,否则时间一长,这个错误的记录就会变成记录的事实。另外表格很可能会跟部分COT冲突,如果允许,可以关闭其他COT,来增加表格插件的运行稳定性。

表格的使用有一定的技巧,比如在首次对话的时候,专注于做场景、时间方面的设计。比如明确有多少个场地、多少个房间、今天是几月几日星期几之类的。尽可能让表格将这些重要情报记录,这样可以在后期少一些问题。另外,部分token需求量非常爆炸的卡片,gemini可能会爆前后文,使用表格反而可能会导致生成质量下降,具体问题请具体分析。
2.2、隐藏
隐藏这个技巧通用性很强,主要是为了减少输入的tokens和增加AI的注意力。如图,我们首先需要打开“显示楼层数”这个功能。以确保我们知道当前对话所处位置。

随后,在确保总结已经完成的前提下,可以隐藏前面的部分楼层,以达到降低输入tokens数量,促使AI将注意力集中在最后发生的故事上。以Deepseek举例,对于超长输入tokens,其有效注意力大约在最后的2k tokens上,前后文注意力最佳为8k tokens。换算下来就是,单次输入总长度应该限制在2500中文字以内,前后文应该限制在10000字左右。
根据上文这个计算方式,我们可以大约计算一下自己的对话10000字左右是多少层楼,随后每过一段时间,在对话框中输入“/hide 1-XX”命令。其中“XX”是指隐藏至多少层楼的数字。比如我当前每层楼输出约1500中文字,考虑到递归数列,大约4次对话就会占用满注意力。所以我们可以每过5层楼,就输入一次“/hide 1-XX”的命令。比如在第五楼的时候,输入“/hide 1”、第十楼的时候输入“/hide 1-5”、第十五楼的时候输入“/hide 1-10”,以此类推。
注意,当前deepseek前后文长度是给了64k的,上文这个麻烦的做法,仅针对注意力不集中的情况,上文建议仅基于理论。在实际游戏过程中,可以不用那么频繁进行“/hide”操作,具体问题请自行分析。另外,gemini或者claude的前后文长度和注意力问题可能会比deepseek更好一些,但是blog主实在无力进行测试了。
3、酒馆助手(必装插件)
接下来BLOG主介绍一些进阶的玩法,部分制作精美的卡片,允许加载UI和人物立绘,拓展了许多酒馆的玩法。

比如跟有自己的UI界面,像GAL或者跑团一样,能骰点。

有比如对状态栏进行美化,还允许折叠信息

再或者构筑一个武侠世界,允许加点和选择门派、流派等等。
这些所有的内容,都需要依赖一个可以在酒馆运行HTML脚本的插件。我们根据下图所示,点击“安装扩展”按钮,并在弹出的对话框中,输入“https://gitlab.com/novi028/JS-Slash-Runner”该链接,稍等一会,就会看到最下方出现一个全新的“酒馆助手”选项卡。记住打开“启用扩展”功能,其他的选项也都是字面意思,很好理解,按需开启就行。另外也需要注意人物卡介绍里面是否有表述特殊的设置方法,也需要记住平时有空点一下更新按钮,确保酒馆助手一直都是最新的状态。完成该设置后,即可在酒馆中显示UI、图片、音乐、动画等多种多样的内容(前提是人物卡中预设了这些内容)。

另外,在安装完毕后,可以点击扩展页面下的“管理扩展”按钮,随后点击“Update all”来定期更新所有插件的最新版本,以获得全新的特性。
4、关于“出现英文/韩文/日文”等问题(感谢群友艾因利奇曼提供的截图)

有时候,会突然之间发疯,AI回复一大段另一种语言的文字。这种情况一般是Gemini thing系列AI的通病。出现的概率BLOG主测试大约是3-5%左右的概率。有时候也不一定是整一大段出现外文,也可能是突然中间穿插几个不知道什么语言的文字,或者某些敏感词变成了外文的情况。

这些问题,都是当前AI生成中不可避免遇到的问题,他跟COT、文风之类的都没有关系,是纯粹的概率问题。因此,当前可以通过使用控制能力更好的“预设”来一定程度上解决。但是即使如此,也不能彻底解决,更好的方法是重新生成一次答复。
5、增强消息提醒插件
酒馆的生成通常都是以分钟计算的,总不能每时每刻都看着酒馆页面吧?但切出去看视频/游戏,又容易忘了酒馆回复。这个插件就是为了解决这个问题诞生的,可以在系统右下角弹窗,以提醒你完成了新消息的生成/报错。

安装也非常简单,打开酒馆插件页面,点击安装扩展,随后复制以下链接到弹出的对话框上。
https://github.com/Mooooooon/silly-tavern-reminder

根据实际需求,点击为所有用户安装,还是仅为自己安装,然后等待几秒钟就会安装完成。如果安装失败,请检查梯子。
