博客翻译÷谷歌通用翻译工具可以克服语言障碍

据深圳博文翻译公司从网易科技获悉,据国外媒体报道,谷歌翻译团队有决心信念终结不同国家人们交流间的语言障碍。该团队正在开发一款支持语音的通用翻译系统。

德国《明镜》周刊报道称,这个项目是谷歌“登月计划”中的一部门——“登月计划”是这家互联网公司开展的超前的、空想式的应用产品开发机制。固然该翻译系统远未达到完善的地步,不外目前谷歌已经开始开发一款支持语音的智能手机翻译应用,现在已可以翻译大概24种不同的语言。

《明镜》表示,这款应用已经能良好地运行,条件是给出的句子比较简朴。文中举了一个汉语普通话的例子,终极翻译的结果与正常说话别无二致。

但谷歌翻译团队主管弗朗茨·约瑟夫·奥赫(Franz Josef Och)以为,目前这款支持语音的翻译应用运行得非常缓慢,质量也不能保证始终如一。但他指出,鉴于谷歌基于文本的翻译服务在过去几年中有不小改善,预计这款应用也可以有同样幅度的发展。

奥赫表示,目前最大的障碍还是确定语言中那些微小的差别,例如句法和双关。

这项翻译工程的有趣之处在于,公司这个团队里没有认为语言学家。相反,翻译应用设计的重点在于改进体验。因为谷歌的专长在于收集、归类、并分析数据,所以翻译的算法并不是用来明确语法规则,而是用来“在信息片断中搜索,收集数据并逐渐学习。

这就是为什么固然谷歌翻译过的句子固然可以被人理解,但是还需要按照语法进行一些编排才能看起来像寻常的语言。不外考虑到谷歌用户去年一年使用翻译工具的次数超过2亿次,公司应该能得到完善这项服务所需要的信息。

安卓救了一条命!帮助孕妇分娩

【PConline 资讯】手机App可以神通广大到何种程度?近日,安卓上的Google翻译App就诠释了什么叫做神奇。据报道,爱尔兰的医护人员帮助一位语言不通的孕妇顺利产下了婴儿,Google翻译可谓居功至伟!

爱尔兰当地媒体报道称,在Google翻译的帮助下,医护人员指导一位语言不通的母亲成功产下女婴。该产妇来自刚果,只能够使用家乡语言斯瓦希里语——这个语言并不热门,很难找得到翻译。当时医护人员正将产妇送往医院,但是由于产妇即将分娩,情况十分危急,医护人员只能将其停在爱尔兰乡间的半路上进行紧急分娩。然而这位母亲并无生产经验,医护人员给其的指示也无法正确传达,情况变得非常危急。

随后,Google翻译就成为了救世主!据当时的医护人员Gerry McCann和Shane Mulcahy回忆,McCann用安卓机开启了Google翻译,虽然效果并不完美,但还是将医护人员的英语指示基本准确地翻译成斯瓦希里语传达给这位母亲。在当地时间上午6时23分,这位母亲成功地生下了一个健康女婴。

Google翻译无疑是最优秀的移动平台翻译软件,无论是语种支持、功能创新还是内容准确度都有上佳表现。最近Google翻译还推出了Word Lens AR技术翻译,非常黑科技,大家可以。目前越来越多的Google服务无法在中国正常使用,希望Google翻译之后还能够为中国人服务吧。

谷歌翻译后,谷歌在中国推出了第二个应用程序

近日,谷歌与华为、小米和百度在内的数家中国应用商店合作,在中国市场推出了新的文件文件管理工具“Files Go”,据悉,这款应用实际上在去年12月就已经发布了,而这款应用则是针对中国的全新定制版本——Google 文件极客。

据官方表示,Google文件极客可以帮助用户:

自主掌控,释放存储空间。针对可以删除的文件提供个性化的建议,包括未使用的应用程序、超大文件和重复文件。用户在使用该应用的前四周中平均节省空间超过1GB。

更快找到、管理文件。无需再在错综复杂的文件夹中费力寻找。通过智能筛选以及强大的搜索功能,将手机中的图像、视频、应用程序和文档自动整理,让你准确找到所需。

离线分享文件。无需使用数据,直接通过手机与旁边的手机进行文件传输。同时,文件传输加密、快速(速度曾达到488 Mbps)并且免费。

官方称,Google文件极客正式在运行Android5.0(棒棒糖)以上版本的Android智能手机发布。

此外,用户也可以从百度、华为、腾讯和小米应用商店里下载应用。

此前,由于不愿意遵守中国相关法律,谷歌搜索服务、应用商店、电子邮件和云存储服务均退出了中国市场。

需要指出的是,“Google 文件极客”是自谷歌搜索等主要服务退出中国市场之后,谷歌在中国推出的第二款应用,也是与第三方应用商店合作开发的第一款应用。

去年,谷歌在中国推出了“Google翻译”,由中国合资企业维护。

值得一提的是,谷歌自去年底开始,便在中国投放了一系列宣传Google翻译强大功能的广告活动,还邀请华裔饶舌歌手欧阳靖来做代言,在微信等平台传播。当然,也取得了不错的效果。

有媒体报道,Google在中国App市场刚达到一个顶峰季度,2018年Q1下载量近800万次,同比去年增长了60%,这其中便有Google翻译的功劳。

报道指出,中国用户长期需要通过VPN来使用Google旗下的大部分App产品,但这些产品均可从中国App Store下载。因此,Google翻译在去年初的直接开通方便了一大批国内用户不再需要VPN,推进了整个Google系产品的发展。

谷歌过去几年在中国一直保持相对低调的态度,但事实上,谷歌一直都在寻找办法扩大其在中国的业务,并在北京设立了AI研发中心。但由于收紧审查条例,其在消费类产品和服务方面的进展并不大。

不过谷歌仍在努力加大重返中国市场的力度,谷歌CEO桑德尔·皮查伊目前已数度访问中国,自去年12月以来,两次在由中国政府主办的论坛上发言。

无论如何,谷歌近来在中国的活动越来越活跃,不知道下一个将出现在中国App市场的Google产品会是哪一款呢?

借助谷歌翻译技术,谷歌文档最终引入了语法检查功能

在漫长的等待之后,Google Docs终于获得了语法检查功能。不仅能够识别容易混淆的英文单词(例如affect和effect),还能纠正错误的时态,规范逗号、句号等符号的使用等等。Google表示这主要得益于已经应用于谷歌翻译上的机器翻译技术,不仅能够翻译句子,而且能够纠正写作过程中的语法错误。

目前谷歌官方并未披露语法检查功能的细节以及人工智能背后的运用。但值得肯定的是谷歌翻译技术近年来发展壮大,精确度已经接近于人类翻译水准。因此,谷歌依赖这项技术衍生出其他应用并不令人奇怪。

现阶段语法检查功能不会立即广泛部署。它会首先面向企业用户推出,而且必须由公司的网络管理员进行激活,以便用户对其进行测试。在今天发布的博文中,谷歌并未透露该功能何时面向普通消费者开放,以及具体支持哪些语言。

谷歌大脑访谈:神经网络翻译是机器翻译的极限吗?

极客公园作者:早优夫斯基

Google 翻译毫无疑问是目前最好的机器翻译工具没有之一,如果还有什么能够超越 Google Translation 那也一定是它自己。

当两天前 Google 推出了全新的整合神经网络的翻译工具——GNMT(Google Neural Machine Translation)谷歌神经机器翻译系统,并且这一系统将最先投入到最困难的汉英互译领域时,科技圈炸了锅。

在 Google Neural Machine Translation 推出的第二天,「极客公园」受邀来到 Google 中国和来自 Google Brain 团队的软件工程师陈智峰聊了聊 GNMT 和机器翻译的未来……

如果机器翻译的未来注定是无限接近于人,那这个未来一定属于「神经网络机器翻译」。

新旧对比,神经网络是机器翻译的「未来之匙」

谷歌神经机器翻译(GNMT:GoogleNeural Machine Translation)系统实现了到目前为止机器翻译质量的最大提升。

相比于谷歌之前基于短语的机器翻译(PBMT:Phrase-Based MachineTranslation),GNMT 需要的设计工程量更少,同时翻译效果更好,讲道理的说 GNMT 的技术将把机器翻译带到一个全新的纪元。

过去的 PBMT 最让人头大的地方在于句子语序,英文到中文的翻译过去主要存在的问题就是词序问题。之前 PBMT 基于短语的翻译方式是先把句子分成一个个短语和单词,然后独立翻译,最后对翻译出来的独立短语解释进行逻辑整理,变成句子。当东亚语言翻译成欧洲语言时语序会有很大变化,单个翻译再调整语序的系统复杂繁琐且容易出错。

而 GNMT 则是将整个句子视作翻译单元,对句子中的每一部分进行带有逻辑的关联翻译,翻译每一个字或单词时都包含着整句话的逻辑。

通俗的讲,如果将翻译比作把食物从生变熟,那 PBMT 像把一颗白菜切碎了烧熟再拼凑起来,而 GNMT 则是将整颗白菜放到锅里煮,变熟后最大程度保持了逻辑原貌。

在使用人类对对比评分指标时,相较于之前也实现了极大的提高,在多个样本的翻译中,神经翻译系统将误差降低了 55%-85%,甚至更高。

在特定的条件下单句的翻译已经接近于人类,谷歌翻译团队会用一些很特别的句子去测试GNMT,例如:「小偷偷偷偷东西」,GNMT 对于这样类似的特殊句子已经能够准确翻译。

而 RNN 则是神经翻译系统中最核心的技术,也是让 GNMT 与众不同的关键。

快速看懂什么是 RNN——机器翻译之心

RNN(RecurrentNeural Network)被称为循环神经网络,是机器深度学习的一种人工神经网络,这种网络的本质特征是在处理单元之间既有内部的反馈连接又有前馈连接它是一个反馈动态系统,RNN 一次处理一个输入序列元素,同时维护网络中隐式单元中隐式包含的过去时刻序列元素的历史信息和「状态向量」,比前馈神经网络具有更强的动态行为和计算能力……

上面这段话相信很多人都看不懂,所以我们换个说人话的表达方式。

传统多层感知神经单元包含了「输入(Input)」、「处理计算(Hidden)」和「输出(Output)」三个部分,模仿人类神经原理。

而 RNN 在传统的多层感知机基础上跟时间沾上边了,下一时间点的「处理计算」会受上一个时间点的影响,会根据上一个输入输出的结果来调整当前的处理计算方式,这就让本来各自独立进行计算的神经网络有了前后逻辑关联的能力。

直观体现就是 GNMT 在 Google 官方的介绍中提到的——Attention 机制,为了在每一步都生成翻译正确的词,翻译解码器重点考虑与生成英语词最相关的汉语权重分布(「注意(Attention)」,蓝色链接的透明度表示解码器对一个被编码的词的关联程度)。

所以谷歌神经网络翻译可以把一整句话作为翻译单元,翻译每一个字词时都会考虑到前面已有的所有字词含义。翻译第二个词时考虑第一个词的含义,翻译第三个词时考虑前两个,第四个词考虑前三个……以此类推,于是 GNMT 就实现了以句子为翻译单元,翻译结果也更加有逻辑性

RNN 被发现可以很好的预测句子中下一个字符或下一个单词,例如在某时刻阅读英语句子中的单词后,将会训练一个英语的「编码器」网络,表现为翻译首单词的概率分布。如果选择一个首单词作为输入,将会输出翻译的句子中第二个单词的概率分布,并直到停止选择为止。

不过原生的 RNN 会遇到一个很大的问题,叫做 The vanishing gradient problem for RNNs,也就是后面时间的节点对于前面时间的节点感知力下降,说白了就是健忘,网络一深就没法训练了,而为了解决这个问题用到的就叫 LSTM,引入了简单来说就是你不是健忘吗?给你拿个小本子把事记上。

GNMT 的神经网络就是运用了带有 8个编码器和 8 个解码器的深度 LSTM 网络组成,与其说 LSTM 是一种特殊 RNN 结构,倒不如说 LSTM 是 RNN 的改良版版,多了记忆单元。

NMT 的前世今生

这是 GNMT 第一次正式上线,这也是第一次在传统的自然语言领域这么大规模使用新的深度学习技术,且这一次最先涉足中英领域。

当问起为什么选择最先从中英领域开始,Google 的回答主要是两个基本考虑:1、中英互译的需求量很大,且翻译难度很高,2、整个项目开发参与者中有很多中国同事,对项目开发帮助较大。

而其实早在三年前 Google brain 就很想做了这件事了,但当时软件和硬件都不能够很好的支持,直到后来开发出了 Tensorflow 使得训练类似的模型可以充分利用分布式计算,利用很多很多不同的硬件类型。另外,一些专门的硬件加速器也帮助在短时间内完成这个训练,所以很大一部分原因是因为过去两三年 Google 在机器学习、在人工智能方面的巨大投入,使得类似的操作才变得可行。

来自 Google Brain 的软件工程师陈智峰也表示到目前为止 Google Allo 和 Gmail Inbox 都已经开始不同程度使用 GNMT,并且 GNMT 的底层技术模型是可以运用到很多领域,很多产品都在这个基础模型上都可以做出针对性优化。

虽然已领先时代,但仍有缺陷

虽然 GNMT 已经可以算是领先于整个时代,但机器翻译的缺陷还远未得到完全解决,GNMT 仍然会做出一些人类翻译者永远不出做出的重大错误,例如漏词和错误翻译专有名词或罕见术语,这类重大错误往往是因为训练数据里的缺陷,例如「LinkedIn 领英」,如果词库里没有 catch up 上这个特有词汇,翻译时就会出错。

另外就是虽然现在 GNMT 已经可以将句子作为翻译单元,在翻译时考虑整个句子中每个字的前后关联,但 GNMT 将句子单独进行翻译时还是无法考虑到其段落或页面的上下文的关系。

机器翻译的极限在哪?

机器翻译的极限是完全代替人类吗?答案是:并不能全部取代。

要试图解决这个问题,首先横在面前的就是深度学习基础算法结构的能力限制,虽然Deeplearning 就是指层数更多,但这并不意味着更深层、更多的网络获得更好的效果。

虽然按照逻辑应该是模型随着深度的增加会更强大,但实际中随着层数的增加每次运行的计算量也会指数级增加,当超过一定的量级反而使得使用反应速度下降,所以在目前计算能力没有质的突破的情况下,现实情况下有不同的考虑,并不是越多层越多网络就能带来越强大的深度学习能力。

那这是否意味着目前 GNMT 已经到达了机器翻译的极限呢?

陈智峰的回答是:「还没有。」

好在现有的深度学习 RNN 模型还有很多可开发的空间,例如让模型变得更大或者层数增加,同时在该领域每年也都有新的模型出现,深度学习的模型也会不断迭代,所以 GNMT 目前的技术还远未到极限,更加不会是机器翻译的极限。

对于类似面对更标准化的科技、医学等等固定且有成文规则的文章机器可以更快翻译,准确率也更高,同时像是更注重信息类的新闻翻译做的比较好。

完全替换人的翻译有一定难度,且很有可能是无法实现的,因为现有的机器翻译都是针对现在已经出现过的语言现象,但面对不断出现不断发展的语言来说还是需要人来不断创造新词汇或赋予词汇新含义。

谷歌翻译、百度翻译或阿里翻译哪种翻译更准确

谷歌翻译是国外老牌的翻译,百度翻译是国内的翻译,而阿里推出的翻译准确来说还在试用期。

那如果你想翻译一段文字,你会选择哪个呢?

就此小编做了一项实验。

我们来测试下翻译结果。

谷歌的翻译地址:https://translate.google.cn/

百度的翻译地址:https://fanyi.baidu.com

阿里的翻译地址:https://www.bejson.com/othertools/fanyi/(由于阿里翻译还在公测,只提供了API,所以我们提供了一个使用阿里翻译接口的网站)

第一项测试

现在我们一起来翻译一段中文转英文,也是头条号粉丝们公认的一段话:

“支付宝是全球最好的支付方式”

首先是谷歌翻译:

其次是百度翻译:

最后是阿里的翻译

第二项测试

现在我们来测试一个英文转中文 “Miracles sometimes occur, but one has to work terribly for them”,

这个翻译成中文应该是“奇迹有时候是会发生的,但是你得为之拼命努力。”

好的我们来看翻译:

首先是谷歌翻译:

其次是百度翻译:

最后是阿里翻译:

小编给出的结果就是:

如果是中文翻译成英文,还是阿里的比较好。

如果是英文翻译成中文,百度的更胜一筹。

这个结果其实让小编挺汗颜的,因为小编其实是一个谷粉,但是无奈谷歌翻译平平呀,也许谷歌在翻译其他语言方便会更好。

谷歌地图将无缝访问50种语言的文本和语音翻译

为帮助旅行者在出游的时候更好地用当地语言交流目的地,谷歌正在将谷歌翻译(Google Translate)无缝接入谷歌地图应用(Google Maps)中,这样,旅行者就可以在查询地图和导航的同时,获得地名地址的准确翻译,方便他们向当地出租车司机和路人询问。

谷歌地图产品经理 Laszlo de Brissac 表示,他们希望通过将「Google Maps 和 Google Translate 紧密结合在一起」来解决这种情况,这项功能不仅提供文本翻译,也支持语音翻译,每个地点名称旁边都会有一个小扬声器图标,点击图标会自动发出声音,以本地语言大声朗读信息,并为地址专门提供一个单独的选项。

此外,对应功能的对话框还直接链接到谷歌翻译,用户可以通过翻译后续短语(例如“非常感谢您的帮助”)来继续和当地人对话交流,不再受语言障碍的束缚。

这也是谷歌在地图和翻译两个平台之间,首次建立深层次的集成,进一步提升协同作用。该功能计划在下个月登陆 iOS 和 Android 上的谷歌地图应用,支持 50 种语言,并在未来追加更多语言。

谷歌翻译推出实时语音转录

IT之家3月18日消息 据XDA报道,谷歌于几个月前开始测试一项名为“持续翻译(Continuous Translation)”的新功能,该功能于今年1月面向公众,目前该功能名为“转录(Transcribe)”,未来几天将向所有安卓用户推送。

顾名思义,转录功能即为用户以一种语言口述,而谷歌翻译可以近乎实时将内容转化为另一种语言的文本。外媒表示,此功能的应用场景十分广泛,可以用于翻译自己的口述内容、多人的对话以及其他设备播放的内容,“从演示来看,翻译过程中没有明显的处理延迟。”

IT之家获悉,该功能与当前的语音翻译不同,后者需要语音输入后稍作等待才可以看到结果,谷歌表示其不太适合用以翻译“较长的讨论”。

外媒表示新的转录功能使用起来十分简单,点击功能按钮后进入“收听”界面,可以设置页面主题、文本大小和语言等,点击麦克风图标即可控制开启/暂停转录。

谷歌翻译每日查询超过1000亿字,强化每日对话的翻译效果

Google 翻译(Google Translate)是相当实用的线上工具,也有移动版本供用户随身使用。Google 日前宣布这项服务每天累积查询超过 1,000 亿个单字,并将针对日常对话内容产生更好的翻译结果。

Google 翻译服务打破了语言隔阂,可互译多达 90 种语言,目前提供多种翻译界面,包括键盘或手写输入、以及语音与拍照翻译;出外时不需网络连线,可使用离线翻译功能。

https://youtube.com/watch?v=wIK0JKTQcI8%3Frel%3D0

官方日前宣布这项服务每天累积查询超过 1,000 亿个单字,并且表示有成千上万的用户参与 Google Translate 社交,以提升翻译品质。最近推出一项服务更新,针对日常对话内容产生更好的翻译结果,不再只是字面直译。

以上述的例子,Google 翻译识别出用户输入的短句是一般会话,并翻译出比字面直译更接近的结果。

《Google 翻译》的 Android 与 iOS 版本在今年上半年都发布更新,加入镜头翻译与语音输入翻译的功能。例如到了国外旅行,只要将手机镜头对准路牌或文字,《Google 翻译》将会立即翻译文字;而开启语音输入,《Google 翻译》可自动侦测语言并进行翻译,与外国友人交谈更顺畅。

我们该怎么办?

半年前,我发布了文章《谷歌翻译憋大招,究竟为哪般》,而就在昨天,谷歌翻译的大招,终于憋出来了。神经机器翻译系统(GNMT)承担起了翻译的重任,翻译错误率降低了55%到85%——妈妈再也不用担心孩子的英语学习了,因为他们今后可能不需要学英语了——结合语音识别技术效果更佳。这可能是比搜狗智能输入法发布意义大得多的历史性事件。

然而404,百度,有道,腾讯,金山什么时候跟上来?而且,几家欢乐几家愁,今后还需要翻译不?这才是人工智能的正确打开方式。

谷歌翻译的提升之处,就在于基于短语的翻译提升到了基于句子的翻译,而且大幅改进了对罕见词的翻译精度。它的机器,可以自主学习。如果一个AlphaGo能够通过自主学习成为顶级围棋大师,那么它学习语言也不成问题,不过这个棋局略大,谷歌要支持超过10000个语言对。中英文翻译肯定是重点照顾对象。它现在还不及人工翻译,毕竟基于句子,联系上下文的语境上还不够。

这个机器翻译的重大突破,其最重要的意义或许就是能把全世界无缝联系到一起了。互联网虽然早已成为地球村,然而这个村子里语言不通,实际沟通效率并不高。而翻译工具的飞跃,让地球村的村民们可以任意无障碍地交流,这个基础上,整个世界都会因此全面改变。或许用不了几年,只要我们带着手机,就可以暴走全世界,与所有能看到的人自由交流了——别忘带充电器就好。

这样,互联网革命就有了这几步——系统的革命,搜索的革命,社交的革命,以及最新的翻译的革命。谷歌站在翻译革命的风口上,它的最大的对手是Facebook,这个世界级的社交网络里,数十个语言版本下,最需要实现内部整合。即打破语言的边界,与不同国家的人们交朋友。他们这样就成了世界公民,民族之林的概念就淡化了。全球化进一步加速。这真正有利于全人类。

然而404,然而404!衷心希望扩大对外交流,不要落后于时代!

作者:姜洪智 | 来源:iDoNews专栏