昨天,Google 给他们的机具意译服务进行了一次大更新,Google 意译的产品现在已经据称在八种语言的互译中使用了机具修业的作法,跟之前以“短语”为单位的意译方式不同,机具修业分类法以“句子”为单位进行意译。

今年 9 月的时候,Google 已经发布过论文来展示机械意译怎么用上机具修业作法,而现在,机械修业功能部分上线了,包括英文、法语、西语、葡萄牙语、国语、德语、韩文、日文和土耳其语这几种语言之间的互译。

Google 产品经理 Barak Turovsky 昨天告诉《好奇心日报》,“在目前支持的所有主要语言中,新的机械意译错误率减少了 55%—85%。”

但具体意义如何,我们通过中英互译自己试了一下,你们也可以直接用 Google 的 API 笔试:

这段笔墨来自《好奇心日报》的文章“无麸质”食物是如何在美国流行起来的?

左边的是我们输入的笔墨,右边上部是原来的机械意译,右下是新的解法的意译结果。这样看起来改进还挺明显的,尤其是语序的改变,没有完全按照国文的语序来写了。

再笔试一些更难的。

 

中翻英笔试选的是以下笔墨,来自于《外语学刊》2014 年的一篇语言学研究,还有张爱玲的演义《封锁》,总体来说功用不错:

 
 

中翻英的效应看起来不错,一般的新闻、学术文章意译之后读起来句子通顺,句子结构也进行过优化。张爱玲的演义句子,意译之后如果不去纠结用词,读起来也没有什么大问题。

英文意译成国语笔试,我们从新闻网站“MIT 科技评论”和演义《美丽新世界》摘抄了几段话来笔试:

 
 

虽然已经比之前的机具意译质量要好,但英翻中的效率明显要比中翻英别扭一些。常用的新闻笔墨英翻中后还能看明白,但文学作品的作用就不那么理想了。

Google 产品经理 Barak Turovsky 说,目前 Google 意译使用中,有 50% 都是用来意译长篇的论文。

而应用了机械修业的作法之后,他们还做了一些有意思的尝试,例如尝试解决那些很少用的方言意译。

“我们将推出的多语言模型可以实现‘零资源修业’,比如说,我们没有日韩互译的资源,但通过多语言模型的英韩、日英互译,也是可以实现韩日互译的……如果我们推出英文和印度某种方言的意译,再通过低资源的训练,那么就可以推出不同方言间的互译。”

总体来说,Google 机械意译质量提升还是挺明显的,目前就这 8 种语言之间,你基本可以用来意译国外的资讯和学术文章了。

但要说达到真人译者的水平,或者替代真人译者,这目前还是不可能的。


友情链接: 城市分站