十分钟,一本书:AI翻译的魔法之旅

in #cnlast month

我的英语水平很一般,读一本英文原版书往往要花掉大半个月时间,生词更是一个接一个地冒出来,让人怀疑自己是不是打开了错误的书。不过,硬着头皮啃英文书的好处还是很明显的,词汇量蹭蹭涨,也能慢慢习惯不同的语法结构。只是,这种“原始式”的阅读效率实在太低了。

几年前,我和几个朋友组了个翻译小队,大家约定每周翻译几章,一起搞定一本叫《钱从哪里来》的书。这本书是一个前银行劫匪的自传,内容挺有意思,可惜计划赶不上变化。中途有人退出了,翻译工作就慢慢停滞了。到最后,这本书只完成了大半,剩下的章节只能留给读者去脑补了。

我后来想,语言真的是认识世界的一道屏障。会多一门语言,就像多了一个钥匙,可以打开一个新的世界。到了2023年底,我遇到一个棘手的问题。在Zliberay台上,有不少安全生产的资料,但几乎全是英文版。那些密密麻麻的英文让我头大,偏偏又是工作需要,拖延不得。幸运的是,那时候人工智能技术开始崭露头角,我找到了一个“偷懒”的方法。

具体操作也不复杂。我先把PDF或ePub格式的书籍转换成Word文档,用百度网盘的识别工具就能完成。然后再把Word文档存成网页文件,用Edge浏览器打开。Edge浏览器有个自动翻译功能,我边浏览,它边翻译,最后再把翻译后的内容存成Word文档,一本“翻译书”就这样诞生了。

当然,Edge的翻译水平有点拉胯,感觉是省钱模式的人工智能,勉强能看懂,但流畅性差了点。后来这个翻译功能不知道是被滥用还是别的原因,逐渐就不提供服务了,我也只好另想办法。前不久,马斯克的X.AI平台上线,每月给开发者25美元免费额度,我立刻想到可以用这个来干翻译大事。

我发现一个叫沉浸式翻译的谷歌插件,只要填上API Key,就能轻松实现双语甚至更复杂的翻译。但坑爹的是,我之前申请的API Key两次都被无情封号,直接导致这个路子断了。好在有了X.AI的新工具,我又有了动力。于是,我决定自己写段代码完成翻译工作。

刚开始,自己写代码的感觉很新鲜,但也充满了挫败。尤其是遇到DOCX文件的时候,我才明白Word文档的“肚子”原来这么复杂!它内部是以HTML格式存储的,稍不注意格式就会乱套。不过,有个AI写代码的工具叫Cursor,真的是我这次的救世主。按照我的想法改了几轮,程序终于能自动翻译并保留大部分原始格式了。

最近,我试着翻译一本2024年布克奖的获奖书籍《轨道》。用自己写的程序,10分钟就完成了翻译。结果还是有点不完美,比如加粗、居中这些格式丢失了,后续得再完善。可即便如此,这个翻译速度已经让我惊喜不已。更重要的是,这次翻译经历让我意识到,只要愿意探索,人工智能能把我们带到更广阔的世界。世界没有那么大的边界,很多时候,我们只差一个开始的勇气。

借助Cursor这个AI编程神器,我开始尝试编写属于自己的翻译程序。从最简单的文字翻译,到后来增加表格、图像复制等功能,整个过程花费了两三天时间。其中最令我惊讶的是DOCX文件的复杂性,将其解压后,竟然是由类似HTML的网页格式文件组成。

后来,我又有了新的想法。提醒Cursor将ePub文件像ZIP文件一样解压,保留原有的CSS样式,只翻译文本内容。果然,代码变得更加简洁高效。

人工智能不仅仅是一个工具,更是打开未知世界的钥匙。它正在悄无声息地拓展每个人的认知边界,消除语言的藩篱。但关键在于,你是否怀揣着探索的热情,去发现值得探索的世界。

我顺便也将我的代码上传到github上,我的仓库地址是:https://github.com/suyaoyong/groktrandocx; 如果你有grok的apikey,也可以克隆我的仓库用,别忘记给个star,这可是我的第一个public的仓库,嗯,我感觉还有点用的代码。