
AI蓝皮书:AI大模型游戏/小说汉化(翻译)傻瓜教程
承接上个教程(AI大模型即时翻译GALGAME傻瓜教程),可能有朋友觉得哪怕是4080显卡即时翻译速度也不够理想,而且对非GALGAME来说,一次只能翻译一个窗口,也未免过于不方便。因此,这次BLOG主给大家做一个全面、傻瓜的使用AI大模型即时制作汉化补丁的傻瓜教程。另外,如果打不开网站请自己搞把梯子。另外需要注意!所有使用AI翻译的游戏,根据开源公约的要求,禁止以“个人汉化”的名义发布,必须在显眼位置标注为AI翻译作品。另外为帮助实在没有梯子的朋友,BLOG主上传了本教程所需工具,可以点击下载,但仍然强烈建议到github仓库页面下载最新版本。
一、选择大模型
都知道chatgpt强大,但昂贵的价格和极其麻烦的布置(最近连API都锁了区)都让人望而却步。于是经过BLOG主筛选后,决定选择中文中属于第一梯队的“deepseek”开源大模型作为汉化补丁制作的AI大模型。附图为deepseek官网提供的各模型评分。

BLOG主精选了当前所有免费的在线翻译和“deepseek”AI大模型进行对比,选择的原文是一段来自日本维基百科上的日文原文。
高校を卒業した岡崎 朋也と遅れて卒業したヒロイン古河 渚のその後を描いたものである。朋也は卒業後、芳野 祐介の所属している電気工事会社に就職する。渚は病気がちで留年を繰り返しながらも朋也に遅れて1年後に学園卒業を成す。父・直幸の問題により、朋也の会社での出世は果たせなくなるものの、それが朋也と渚が結婚するきっかけとなる。結婚後、渚は岡崎 汐を出産するものの、母親である渚が出産後に死亡する。その後、あまりの虚無感から朋也は育児できず、母方の祖父・祖母である古河 秋生、古河 早苗が5年ほど汐の育児をする。その後早苗の計画により、朋也は汐と二人で直幸の故郷へ旅行し、祖母の岡崎 史乃と面会。祖母は直幸の過去を語り、これにより朋也と直幸は和解した。その後、朋也が汐を引き取り育児を始めるも、汐は病気がちとなり、旅行に出かけた冬の日、雪の中で倒れる。その一方で、朋也に関係した人達の問題を解決していき、各ルートを攻略することで得られる「光の玉」を拾っていく事により、終盤の世界が入れ替わるきっかけとなっていく。

除了上述,群里还有小伙伴测试了deepL和彩云,可以认为所有免费的在线翻译全面落后于deepseek的翻译质量。另外,BLOG主也测试过sakuraLLM,使用4080显卡跑满“sakura-13b-lnovel-v0.9b”模型,其整体翻译质量还是不如deepseek。可以认为,除非是选择规模更大或者专业化程度更高的大模型(开源当前没有),仅从质量考虑,deepseek已经是当前一般民用最好的翻译大模型。
而除了质量这个核心要求之外,选择deepseek的另一个原因则是因为:便宜。先不论deepseek注册就送的500万token(有效期一个月),当前deepseek的费用是10元/500万token,实测翻译一个1M文本量左右的GALGAME,花费约1.5元RMB,哪怕是逆天级别的CLANNAD文本量,花费应该在10元左右。考虑到大多数人的游戏/小说需求,可以认为是充10元用一年,而且AI大模型本身API就可以有各种用法,未来BLOG主有机会还可以继续分享一些其他的项目。
确定选择之后,各位可以选择注册一个deepseek账号,注册后会免费赠送500万token(1个月有效)。完成注册后进入后台,点击创建一个新的“API keys”,创建之后将“key”复制保存好。(注意这个KEY只能在创建页面看到一次,如果后来遗忘只能重新创建,无法找回。)

二、导出日语原文
1、Mtool(超简单的提取文本工具)
要对游戏进行汉化,最重要的是“解包”和“封包”。他们分别的意思是将游戏“破解”导出游戏的原文本,以及将翻译好的文本重新打包回游戏中这两个步骤。但是这两个步骤对个人的计算机水平要求比较高,对于一般玩家而言,推荐使用“Mtool”提取游戏文本。
该工具正常使用完全免费,支持“RPG Maker 2k / 2k3 / XP / Vx / VxAce / MV / MZ / Wolf RPG / TyranoBuilder / SRPG Studio / Kirikiri / SMILE GAME BUILDER / Bakin / Ren'Py / Pixel Game Maker MV”等多个游戏引擎的注入,可以提取出基于该引擎的游戏文本。
我们首先下载Mtool本体,解压缩之后运行“点我打开工具.bat”即可打开工具本体。

打开工具后,将游戏的运行程序(exe后续名的文件)拖入mtool中加载运行。稍等片刻游戏即可正常启动。这里还是以blog主之前教程的“妹!せいかつ~ファンタジー~”游戏举例。将游戏的运行程序“GamePro.exe”拖入MTool的窗口中,等待片刻游戏就会自动启动。

载入游戏完成后,我们点开Mtool工具栏上的“翻译”选项卡,等待全部内容加载完成后(通常要几十秒到数分钟不等),我们可以在这个页面上看到待翻译文本总量约“1.07M”,接下来我们点击“导出待翻译的原文”按钮并点确定。

随后我们就会发现游戏文件夹中生成了一份“ManualTransFile.json”的文件。这就是我们需要翻译的游戏脚本文件,我们可以使用任意文本工具打开,就可以看到待翻译文本的内容。

三、辅助翻译工具
最后一步就是对刚刚导出的文件进行翻译了,BLOG主选择的是工具是“AiNiee”。下载并解压缩后,运行程序。然后在“账号设置”-“官方接口”页面中,选择“deepseek-chat”,然后将第一部中获得的api key复制到中间的文本框中。然后点击下面的“测试请求”按钮,确保出现测试成功的绿色提示,然后别忘了按“保存配置”。

然后我们来到“翻译设置”-“基础设置”页面,根据下图进行设置。其中注意新建两个文件夹,一个名字是“input”,专门放刚刚从MTool中导出的待翻译原文件,另一个新建文件夹是“output”,专门放翻译完成后输出的汉化文件。完成设置后,别忘了点击“保存配置”。

然后来到的是“发送设置”页面,按照下图进行设置。其中翻译行数建议最高不要超过80行,否则可能会影响翻译准确性。携带上文行数对MTool导出的文本可能不太有价值(因为Mtool导出的不一定是顺序剧本)。最大线程数建议根据自己电脑CPU实际线程数进行设置,如果不懂就填“0”。

最后,我们再次确认待翻译的“ManualTransFile.json”是不是已经放进了input文件夹中。

确保没有问题后,我们来到“开始翻译”页面,点击下方的“开始翻译”按钮。然后就是静待翻译完成。由于翻译软件本身的问题,建议翻译的时候还是别操作别的东西了,一旦软件卡死就前功尽弃了。另外需要注意软件中显示的“花费tokens”和“花费金额”只是一个估算,跟deepseek中实际产生的费用不一致,因此不用紧张,实际花费要少20%左右。

经过统计本次翻译共计耗时约20分钟(MTool中统计的文本量为1.073MB,json实际大小为1.8MB,这是由于翻译脚本文件是由日语+中文组合而成的,所以会占用更多的空间)。本次翻译实际产生费用为:1.4元。其实“妹!せいかつ~ファンタジー~”这个游戏的文本量在黄油中是非常庞大的了,大多数小黄油的翻译费用甚至不到0.1元,而一个正常规模的GALGAME翻译费用约2-5元,哪怕是规模最大的CLANNAD,整体的翻译费用应该也在10元以内。

等全部翻译完成后,我们可以在output文件夹中找到“ManualTransFile_translated.json”命名的文件,这就是本次翻译好的成品。接下来只需要通过MTool再次加载游戏,并在“翻译”页面点击“加载翻译文件”,选择翻译好的脚本,就可以安心享受完全汉化完毕的游戏了!

四、进阶教程
进阶部分主要分成两个,一个是翻译用的“字典”,另一个则是MTool还没适配的游戏引擎如何提取的问题。这里就不做过多的介绍,仅作为抛砖引玉。
1、字典

如上图,AiNiee内置了非常细致的字典分类,从世界观、人物、特殊词语都做了专门的分类。部分游戏的专有名词比较多,部分人名也喜欢用简称、昵称。也有一些谚语或者俗语大模型可能比较难翻译,这部分内容可以通过提前输入,让大模型在翻译的过程中对这些内容进行准确翻译。具体相关的内容,可以使用KeywordGacha工具,自动提取游戏中的关键词(需要二次确认),或者查询中文网站萌娘百科。日文也可以直接到游戏的官方发布页面去看看。
2、更多的游戏引擎解包
纵然MTool已经覆盖了相当多种的游戏引擎,但也还是存在部分引擎缺失的情况。这时候可以学习使用Translator++来代替MTool进行脚本提取。必须说明的是,不是所有游戏都支持文本提取!如果遇到非常偏门的游戏,就是无法提取文本进行翻译(部分厂就喜欢搞自研引擎或者加一大堆私货),那还是老老实实使用即时翻译吧。
四、总结
终于把这个AI大模型翻译的两篇教程写完了!对于大多数玩家来说,在AI翻译模型的支持下,畅玩90%的GAL真的不再是问题。但作为风铃汉化组的组长,我心里面也是百感交集。当前AI汉化质量,基本上跟一个N2甚至N1的翻译人员水平相当,虽然在纠错能力上还有所欠缺,但是其成本低、速度快的特点,干趴大多数用爱发电的翻译不成问题。或许不久的将来,语言问题不再是阻碍文化之间交流和传播的阻碍,我们也将不再依赖汉化者们日以继夜的努力产出。但也希望大家不要忘记,正是国内无数汉化者们无私的奉献,才让我们度过了黎明前的长夜。


28条评论
ASDN9
没想到吧,一个默默无闻的网友经常逛你的网站
huoyanyan
=W=感谢感谢,今晚还有新测评出来
akashi_mio
api速度太慢了,而且实际翻译质量其实不如gemini
AChou ZIK
发现一只隐藏的大佬!网站内容丰富多样,很多内容也都很有用!而且一直自律更新博客,我的博客网站就一开始写了点东西,后来新鲜劲一过就懒得打理了,现在荒废一年多了。。。。。。
huoyanyan
感谢支持!贵在坚持=W=
123522
大佬,按你的教程配合上一篇的离线模型成功加载了,但是好像只能自己配合MTool使用。请问如果想制作成他人可以使用的汉化补丁还需要学习哪些内容呢?
huoyanyan
联系直接配合mtool使用,要交给别人直接跟mtool一起打包就好。否则你就需要学习一大堆解包,封包的内容了
123522
好吧 本来还想去2dfan赚点积分的 看来门槛还是太高了
huoyanyan
2DF也是发的我这种。。。你用Mtool搞好发汉化脚本就行了。我只是因为汉化组的尊严不允许我直接发机翻的2333你可以随意
123522
啊,2dfan可以直接发.json的文件吗?我之前下的几个好像都是直接替换文件的那种,比如bishop的一般都是个boot文件..
oishipop
试着运行了一会儿,然后deepseek就给我把号封了。。。
huoyanyan
啊??你做了些啥。。。我确实知道有些人会被封,但是我至今都没被封过。。
oishipop
跑了个黄油的文本,还没跑完,准备有空再挂着跑的,结果封了。
还有我的api key是先拷贝到txt上再添加到软件上的,不知道有没有影响
huoyanyan
跟api没关系…这还真是没想到,可能是你那个小黄油太黄暴了…换本地模型吧
DaWiiX
太感谢了,非常有帮助❤️
death
用不成, deepseek审查实在是太重了. 翻译日语gal极其容易触发. deepseek应该是有史以来达到sota阶段审查最重的模型没有之一.
huoyanyan
没辙,那换其他大模型或者本地吧,最近sakuraLLM新出的那个1.5B非常牛逼,直接用就行。
hAsEn
四年没碰gal本地化的东西,看到这篇文章感觉自己就像个原始人
以前光是找引擎相对的解包工具都得GitHub+Google组合拳,一翻就是老半天
huoyanyan
笑死,已经更新了,过几天写。我十几年前就开始做汉化,那时候拆包都是专用工具,要单独写的。那时候还没github什么事,搞这个的都知道:http://asmodean.reverse.net/pages/news.html这个网站233
ainomelody
最近准备用大模型汉化小说,看了下我本地最大能部署r1蒸馏的32b的模型,翻译质量和你在评论区里推荐的那个sakuraLLM的1.5b的哪个更好呢
huoyanyan
不知道…如果你测试了可以回复一下结果
Indor
日文的话用sakura14B/32B(后者参数量大,前者版本新),32b的r1也是和sakura14b一样在qwen2.5的基础上蒸馏的
huoyanyan
sakuraLLM实测14B以上就很好用了,不过新出的哪个1.5B其实也还可以。
会呼吸的汤圆
大佬,这个报错啥意思,我按照教程一步一步来的
发不了图片,只能发文字了
[INFO] 即将开始执行翻译任务,预计任务总数为79,同时执行的任务数量为4,请注意保持网络通畅...
[ERROR] 翻译任务错误 Expecting value: line 1 column 1 (char 0)
[ERROR 翻译任务错误 not enough values to unpack (expected 5, got 4)
huoyanyan
有点不确定。。似乎是程序本身有问题。尝试换个API或者本地模型试试?
hAsEn
MTool+AiNee确实能很快就玩上翻译版本,但似乎并不支持单独启动
每次打开游戏都得带着MTool一起先加载一遍翻译文件,感觉好拖泥带水......
hAsEn
主要是想填一个以前落下很久的krZ的坑,用的SakuraLLM的模型
我还以为MTool是直接把译文文本注入替换游戏源文本,或者能打包一个补丁出来单独启动
huoyanyan
确实,但是个人如果要解包和封包,那确实很麻烦,MTool至少简化了这个流程。如果你确实不想拖着MTool,可以去搜索一下相关的内容。