前言

我前几天尝试了使用gpt3.5 turbo的API进行实时汉化玩Galgame,然后发现汉化效果非常好,除了H的部分不给汉化以外,均能很准确的表达出原本的含义,虽然不能做到绘声绘色,但是普通的理解足够了。毕竟我想自己汉化的都是拔作所以也不需要那么好的文采。但是实时汉化有许多问题,其中最为严重的是我发现我使用的LunaTranslator似乎并不能实现连续翻译,也即通过连续和Chatgpt对话实现一步一步翻译来保证最好的上下文联系,也不能正确对准各种姓名的翻译。另外它实现的上下文联系貌似是通过每次翻译一句话都给四句话来实现的,这样会使用四倍的tokens,导致成本上升。另外实时翻译也有延迟之类的问题。为了解决这些问题,我打算开发一个能够直接翻译Galgame本地文件的工具,能够最大化最优化使用gpt的连续对话功能保证上下文一致。同时尽量对汉化的prompt执行更多地调整来优化汉化效果。这就是SoraTranslator的构思由来。

程序结构

前端

SoraTranslate我想做成一个带有前端的软件,用Vue.JS编写,这个前端能够显示所有的源文件文本,对比翻译后的结果并进行修改(或者直接由源文件自己写翻译)。这个前端也会有调用各种功能的按钮,包括选择文件进行翻译,打包翻译结果等(虽然我觉得本地文件的操作可能还是手动来的方便,但是我还是想最大化低自动化整个翻译过程)。该前端我也希望能够作为手工汉化的一个方便校准和调校的工具,即使不调用任何机器翻译功能也能为汉化工作者带来便利。

后端

后端我肯定是选择Python来实现各种功能。我打算将后端分为两个部分IntegratorsTranslators
其中Integrators用来实现提取游戏文件,筛选游戏文件并对游戏文本进行parse。这些功能应该最后提供一个用.csv格式存储的明文文本方便翻译器调用。同时我也想尽量增加这个.csv文本的可读性(指用Excel之类的工具打开时)来方便一些可能的用图。
Translators就是各种翻译器,其表层应该有和.csv文件的交互的各种函数,内层则是各种各样的机翻工具,我自己是只打算写gpt api的相关工具,但是既然是开源的软件也欢迎别人写其余的工具(例如谷歌翻译等)。

小纪

我完全不会写前端,所以整个前端的书写,部署过程都需要ChatGPT协助,我也不确定最后会变成什么样子,看看效果吧。同时我对Galgame汉化也是完全不了解,还好有Dir-A大佬提供的各种教学视频,也得是现学现用。想想这个项目就刺激。

最后修改:2023 年 12 月 17 日
如果觉得我的文章对你有用,请随意赞赏