用于谷歌翻译应用的离线神经机器翻译支持59种语言

据外媒Techcrunch报道,目前,当iOS和Android版Google翻译应用联网后,其翻译质量远远优于离线时的翻译质量。这是因为离线翻译是基于短语的,这意味着它们使用的是旧版机器翻译技术,而不是联网时可以访问的机器学习驱动的系统。但这种况正在改变。Google现在在其翻译应用程序中推出了59种语言的离线神经机器翻译(NMT)支持。

周二,只有少数用户会看到更新的离线神经机器翻译,但Google会在接下来的几周内推广给所有用户。

支持的语言列表包含各种语言:南非荷兰语、阿尔巴尼亚语,阿拉伯语,白俄罗斯语,孟加拉语,保加利亚语,加泰罗尼亚语,中文,克罗埃西亚语,捷克语,丹麦语,荷兰语,英语,世界语,爱沙尼亚语,菲律宾语,芬兰语,法语,加利西亚语,格鲁吉亚语,德语,希腊语,古吉拉特语,海地语,克里奥尔语,希伯来语,印地语,匈牙利语,冰岛语,印度尼西亚语,爱尔兰语,意大利语,日语,韩语,拉脱维亚语,立陶宛语,马其顿语,马耳他语,马拉地语,波斯语,波兰语,葡萄牙语,罗马尼亚语,俄语,斯洛伐克语,斯洛文尼亚语,西班牙语,斯瓦希里语,瑞典语,泰米尔语,泰卢固语,泰语,土耳其语,乌克兰语,乌尔都语,越南语和威尔士语等。

过去,在移动设备上运行这些深度学习模型并非真正的选择,因为手机没有合适的硬件来有效地运行它们。现在,由于硬件和软件两方面的进步,这不是一个问题,Google、 微软和其他公司也已经找到了将这些深度学习模型压缩到可管理的大小的方法。Google表示,每种语言只有大约有30到40MB。

值得注意的是,微软今年早些时候还宣布了其Translator应用的类似功能。它使用了一种非常类似的技术,但暂时只支持十几种语言。

谷歌翻译甚至读过《圣经》

IT之家7月21日消息 谷歌翻译是一个方便的工具,其背后也有着基于人工智能的学习技术。但是日前外媒Motherboard整理了来自Reddit论坛的帖子发现,谷歌翻译在学习的过程中可能受到了输入来源的影响,竟将一些意味不明的语句翻译成了如圣经一般的语言。

比如,若用户将翻译设置为从毛利语翻译成英语,之后输入一长串的“dog”(英文意为“狗”),最后会得出这样的结果。

翻译出来的英文大意为:

世界末日时钟在12点3分钟,我们正在经历世界上的人物和戏剧性的发展,这表明我们越来越接近末日和耶稣的回归。

据称,推特和Reddit的用户对这些奇怪的翻译也展开了热议,有的网友将其归咎于恶魔,有的人认为这是因为用户滥用“建议”功能进行“纠正”所致,或者是一些对谷歌不满的员工在作怪。

哈佛大学助理教授,研究自然语言处理和计算机翻译的Andrew Rush认为,这些神秘的翻译结果可能和谷歌几年前采用的“神经机器翻译”技术有关。他表示,在神经机器翻译中,系统训练用了一种语言的大量文本来和另一种语言进行相应翻译,以在两者之间创建模型。但当输入的是无意义内容时,系统就会出现“幻觉性”的输出结果。

由于谷歌这一学习系统的原因,类似的翻译结果层出不穷。据悉,在设置从索马里语言翻译成英语的时候,谷歌有时翻译也会念起“圣经”,比如下面这个例子。

其大意为:

因为上帝的名字是用希伯来语写的,所以用希伯来民族的语言写成。

最新的谷歌翻译突破,“注意机制”让机器能够理解单词之间的关系

大数据文摘作品,转载要求见文末

作者 | Devin Coldewey

编译 | 白丁,大饼,钱天培

I arrived at the bank after crossing the street.

I arrived at the bank after crossing the river.

拿到这两句话,你会怎么翻译呢?你觉得机器翻译又会怎么处理呢?

机器翻译的缺点

机器翻译虽然是一大利器,但也有一些缺点,比如说:按照“一个字一个字”顺序翻译的机器翻译模型往往会导致严重错误发生。

谷歌在其研究日志(Research blog)中发表了一篇趣味十足的文章,详细分析了这个问题并给出解决方案。

谷歌自然语言处理部门的Jakob Uszkoreit用以下两句话阐释了这个问题:

I arrived at the bank after crossing the street.

过了这条街,就到银行了。

I arrived at the bank after crossing the river.

过了这条河,就到对岸了。

(译者加注:“bank”为多义词,兼有“银行”和“河岸”之意。)

显而易见,“bank”一词在两句话中含义截然不同,但是后台算法很容易处理错 -因为不读完整个句子就无法判定句中“bank”的确切含义。类似这种多义词的现象比比皆是。

如果让我去翻译这句话,我一眼就能看出这两句话中”bank“的区别,但这对翻译系统来说就没那么简单了。如果修改神经网络,使其翻译完一句话后再检查是否有误,有问题的话就再重来一遍,就未免效率太低。

解决方法

为此,谷歌提出了在转换器(Transformer)中建立关注机制(attention mechanism)作为解决方案。

该机制会将单词逐一与句中其他单词进行比对,并检查是否会影响其他词的词义 – 比如,检查说话人是“他”还是“她”,或者像“bank”这样的多义词在句中的确切含义。

在构建译文的过程中,关注机制会把句子中的每个单词与所有其他单词逐一比对。下图在一定程度上说明了这个比对过程的工作机制。

有意思的是,谷歌的方法也让我们有机会一窥其系统的内部逻辑:因为转换器(Transformer)会为每个单词与其他词的关系按对逐一打分,所以你可以看到它认为哪些词是相关的,或至少可能相关的:

(译者注:以上两句话的意思分别是:

那只动物没有穿过街道因为它太累了。

那只动物没有穿过街道因为它太宽了。

“it”这个单词在两句话里面分别指代“动物”和“街道”。)

酷吧?我觉得超酷啊。这是另一种多义词的情形:“it”既可能指代街道或也可能指代动物,而只有读到最后一个单词(“累”或者“宽”)才能明白到底指代的是什么。我们人类自动就能分辨,而机器仍需练习。看起来谷歌的这一系统已经学得相当好了。

最后,如果你觉得“关注机制”这个词眼熟,那你之前一定已经读过了Techcrunch对DeepL的报道。

DeepL是一家机器翻译的初创公司。在报道中公司联合创始人表示他们致力于关注机制,甚至表示谷歌的日志是基于《关注就是一切》(Attention Is All You Need)这篇文章的,谷歌作了一定的修改。

然而,这位联合创始人还认为他们公司的办法非常有效 —— 甚至比谷歌的还好用。

如果你想进一步了解“关注机制”,不妨阅读DeepL发表的论文 Attention Is All You Need(https://arxiv.org/abs/1706.03762)。

原文链接:https://techcrunch.com/2017/08/31/googles-transformer-solves-a-tricky-problem-in-machine-translation/

谷歌展示了谷歌助手的一些新功能:实时翻译和上下文理解

北京时间9月8日早间消息,谷歌本周在欧洲举行了开发者日活动。这场活动已结束,而谷歌近期上传了第二天的精彩视频,展示了谷歌助手的许多新功能。

其中最重要的新功能是谷歌助手的翻译模式。用户可以说:“OK,Google,当我(某种语言)的翻译。”随后,谷歌助手就会用你期望的语言去重复你的话。例如,如果要求谷歌助手去做西班牙语翻译,那么谷歌助手就会以语音和文字方式,将你说的话翻译成西班牙语,直到你要求停止。对谷歌助手来说,翻译并不是全新功能,但这种实现方式更自然,当你前往国外旅行时也会更有用。

此外,谷歌还对谷歌助手进行了多方面优化,从而更好地理解问题的具体语境。在一个例子中,谷歌的演示者要求谷歌助手给他展示托马斯的照片。这个问题本身没有任何语境信息,而谷歌助手展示了托马斯小火车的照片。

随后,演示者又提出了关于拜仁慕尼黑的问题,球队中的球星之一是托马斯·穆勒。演示者再次要求获得“托马斯的照片”。这次,谷歌助手展示的就是托马斯·穆勒的照片。这说明,谷歌助手从此前的问答中提取了信息。

谷歌的演示者还展示了,谷歌助手如何帮助我们回忆起电影的名字。例如问题是:“有一部汤姆·克鲁斯主演的电影,他在里面打台球,同时又在跳舞,这是什么电影?”谷歌助手在思考几秒钟之后给出了答案《金钱本色》,随后还提供了关于电影的更多信息。

除了这些新增的功能之外,谷歌助手目前回答问题的速度变得更快,在嘈杂的环境中能更准确地识别语音,并在回答某些问题时更好地利用谷歌搜索。

谷歌此次还展示了对Google Lens的优化。与今年6月在I/O开发者大会上发布的内容相比,这次并没有太多新的信息,但仍然给人留下了深刻印象。我们看到,Google Lens可以瞄准一枚苹果,知道其中的热量是多少,也可以瞄准三种波兰货币兹罗提,实时计算对应于多少瑞士法郎。

目前尚不清楚,谷歌将于何时推出谷歌助手的这些更新。业内人士猜测,这可能会是在Pixel 2手机发布期间。

四年后,谷歌翻译增加了五个新的语言支持:维吾尔语被列入名单

IT之家2月27日消息 据Engadge消息,虽然不知道原因,但谷歌翻译自2016年起便没有再新增语言支持,直到今天增加了对5种新语言的支持。

IT之家获悉,谷歌翻译新支持的5种语言包括卢旺达语、Odia(印度)、Tata、土库曼语以及维吾尔语。谷歌翻译还支持卢旺达语、Tata和维吾尔语的虚拟键盘输入。

目前谷歌翻译支持的语言总数达到108种类,但这仍只是全球语言总数的一小部分,IT之家整理Ethnologue.com数据得知,世界上大概有7117中口头语言,但前100种可以涵盖绝大部分,这些语言之间的互译对绝大部分人还是有用的。

谷歌地图新的翻译功能可以自动匹配语言并实时输出翻译

北青网综合报道 虽然探索一个新城市可能是一次激动人心的经历,但如果你不会说当地语言,那就有点棘手了,而谷歌地图应用程序中的新翻译功能就会帮上大忙。

谷歌广告说道:“当你一个语言不通的国家时,活动起来很困难——尤其是当你需要和人说话的时候。想想那次你试图和出租车司机交谈时引发焦虑的情景,或者那次你试图漫不经心地向路人问路的情景。这项功能将谷歌地图和谷歌翻译结合起来,能够让手机用当地语言说出特定名字和地址方便用户沟通。要使用这个程序,只需点击地名或地址旁边的新扬声器按钮,谷歌地图就会大声说出来。谷歌补充道:“这种文本到语音转换技术会自动检测你的手机使用的语言,以确定你可能需要帮助翻译的地方。“例如,如果您的手机设置为英语,并且您正在东京的某个景点,您会在该地的名称和地址旁边看到新的扬声器图标,这样您就可以获得实时翻译。”这项新功能将于本月在安卓和iOS上推出,支持50种语言。

一项新的研究表明,谷歌翻译仍然不够可靠,无法为不会说英语的人提供医疗指导

上周公布的一项新研究显示,谷歌翻译仍然不够可靠,无法为不会说英语的人提供医疗指导。有时,它是有效的,将急诊科出院说明翻译成西班牙语时,它是最准确的。但很多时候,尤其是在不太常见的语言中谷歌翻译的准确率并不高,它对亚美尼亚语翻译准确率只有55%,因此在用于医疗或者健康信息翻译的时候,可能造成误解或者危险。

目前美国联邦指导方针规定,医院和医疗保健机构必须为不会说英语的病人提供翻译。这些指导方针是为了规避一个重要风险而设计的,即这些病人因为不理解医生的指示而面临更高的医疗并发症风险。

然而,在实践中,许多医院并没有为每一位需要翻译的病人提供翻译,因为翻译费用很高,许多医疗集团都在为翻译费用而苦恼。即使医院确实有翻译人员在岗,或者订购了电话翻译服务进行口头交流,他们也不太可能有办法翻译书面指示。在为患者提供书面翻译信息的能力方面存在明显的差距。

这份研究显示,医生在医疗环境中求助于谷歌翻译已经变得很普遍。新的研究评估了400个由谷歌翻译翻译成七种不同语言的急诊科出院说明,它们包括西班牙语、中文、越南语、他加禄语、韩语、亚美尼亚语和波斯语。母语使用者阅读了这些译文,并评估了其准确性。总体而言,翻译后的说明书准确率超过80%。

这与2014年相比有了进步,当时的分析发现,谷歌翻译对于医疗信息的准确率不到60%。谷歌翻译在2016年有所改善,当时它开始使用新的算法,从那时起,2019年的一项研究发现,它在西班牙语中的准确率可以超过90%。

但新的分析也发现,不同语言之间的准确率有所不同。就像2019年的研究一样,它发现谷歌翻译对西班牙语的准确率超过90%。他加禄语、韩语和中文的准确率在80%到90%之间。法西语的准确率为67%,亚美尼亚语的准确率为55%,有很大的落差。这份研究认为,依靠机器翻译的一个主要问题是,它无法解释上下文。例如,该程序可能无法识别一个单词是一种药物的名称,导致整体准确率降低。

最终,机器翻译程序可能会改进到可以准确和安全地翻译医疗信息的程度。但基于它们现在的工作方式,现在使用在医院使用机器翻译并不是一个安全的办法。

谷歌翻译不容易使用。看看这些句子的翻译

[闽南网]

­ 据报道,目前仍有一小部分顽固的“地平论者”认为我们的星球实际上是平坦的。近日有人发现用谷歌翻译涉及地平论者的语句时出现了令人惊讶的结果,谷歌表示翻译系统实际上存在错误。

­ Reddit r/funny讨论组中的网友发现了一个翻译异常 。当用户要求谷歌翻译将“我是一个地平论者(Iamaflat-Earther)”从英文翻译成法文时,它会以“Jesuisunfou”的结果出现。而当再把这句话翻译成英文时,用户会得到“我是个疯子(I”macrazyperson)的结果”。谷歌翻译对单个词的翻译没有任何问题。它变成“flat”翻成法语“plat”,“Earth”翻成“terre”。

­ 到目前为止,似乎法语可能是唯一一个具有这种极端变化的语言。如果将“Iamaflat-Earther”翻成西班牙语,会得到“Soyunterreroplano”的结果,当再把这句话翻成英文时,谷歌会帮助翻译成“我是一片平地”(”Iamaflatland”)。

­ 当翻译成德语时,则变成了“IchbineinflacherErdenmensch”,再把这句话翻成英文时,又变成了“我是一个来自平坦地球的人”(Iamaflat-Earthhuman”)。

­ 谷歌表示,翻译不是一个复活节彩蛋。谷歌发言人称:“谷歌翻译通过从网上获得的数百万翻译例子中的学习模式进行翻译、不幸的是,其中一些模式会导致不正确的翻译,错误已被报道,我们正在努力解决问题。”

谷歌是最准确的在线翻译,而科大讯飞取得了小小的胜利

撰文/蓝科技

当下的翻译软件越来越多,但准确性参差不齐。通过简单测试发现,谷歌翻译最准确,有道理翻译和讯飞翻译在国内翻译同行中小胜一筹。

不管是单词查询还是翻译文档,即使天天和英文打交道,我们有时也难免会碰到一两个生词看不懂,因而,在线翻译就成了大家临时抱住的“佛脚”。

百度翻译、有道翻译、谷歌翻译、讯飞机器翻译、腾讯翻译君、搜狗翻译……当下各个公司对于翻译软件研发的侧重点都有所不同,这么多翻译软件,小伙伴有没有挑花眼呢?,当下翻译软件良莠不齐,哪一款才能是最适合的呢?我们来简单测试一下几款在线翻译软件,小伙伴们来按需取用吧。

本次测试选择了日常、谚语诗词的2个汉译英方向,和短语、文章的2个英译汉方向,以下摘选出4个句子,让百度翻译、有道翻译、谷歌翻译、讯飞机器翻译、腾讯翻译君、搜狗翻译6款翻译软件同时翻译,进行横向对比。

汉译英

1、您在3站后需要换乘2号线,到达目的地后,从4号口出站

6款软件在进行简单的句式翻译时,虽然个别单词的应用有所差距,但都表现良好,其中,谷歌翻译的结果更为顺畅,其次是有道翻译。

2、-“唉,天可真凉了。”

-“可不是么,一层秋雨一层凉了!”

面对中国民间谚语,大部分翻译软件都是按照字面直接翻译过来的,考虑到中译英的灵活性,和国家之间文化的差异,这次有道翻译小胜一筹,

英译汉

1、The gothic architecture is just mesmerizing, all those pretty buildings wrapped in vines that go all shades of crimson in the fall – it’s a feast for your eyes.

标准翻译:哥特式建筑令人着迷,这些在金秋里渐变成深红色的藤蔓包裹着的美丽建筑,是一场为游客准备的视觉盛宴。

相较于汉译英,英译汉对各家软件的翻译要求更为复杂,有的软件不能很好的翻译整句话的意思,有的甚至语句不通顺,前后矛盾。通过这次对比,在断句方面,有道翻译的结果更为通顺,且表述完整。

2、First of all, the funny bone is the little bone or part of the elbow over which the ulnar nerve passes. A knock on the funny bone causes a tickling sensation along the forearm, a sensation that is not so much painful as it is numbing and shocking. In other words, when our funny bone is poked, usually unexpectedly, we want to laugh more than we want to cry out in excruciating pain.

面对长篇的段落翻译,各翻译软件都不能很好的翻译funny bone,有的翻译成“有趣的骨头”,有的翻译成“滑稽股”,有的甚至错译成“耻骨”。除此之外,百度翻译的结果语句不通顺。相比之下,讯飞机器翻译更为优秀。

随着科技的进步,各个翻译软件也在不断进步,各有千秋,通过这次横向对比可以比较直观的看到个翻译平台不同的侧重方向,因此,小伙伴们不要盲目下载翻译软件,找到适合自己应用的软件更为重要,相信将来,不断进步的翻译软件能更加完美的匹配大众日常翻译的需求。

四年后,谷歌翻译终于迎来了新的语言支持

据外媒报道,在过去的4年时间里,Google没有在谷歌翻译中增加对新语言的支持。经过长时间的修整后,该家公司今日终于宣布,它将在谷歌翻译中增加对五种新语言的支持。它们是卢旺达语、奥里亚语、 鞑靼语、土库曼语和维吾尔语。全世界有超7500万人在使用这五种语言。

对于这五种新增的语言,谷歌翻译将支持文本翻译和网站翻译。另外,该公司还提到翻译还将支持卢旺达语、 鞑靼语和维吾尔语的虚拟键盘输入。

现在,用户可以在谷歌翻译上查看最新支持的语言。