谷歌AI推出端到端纯语音翻译技术,有望成为未来的“机器同声传译”。

我们先来听一下三段语音:

三段语音说的是同一句话:“你好,我是 Guillermo,你怎么样?(How’s it going, hey, this is Guillermo. How are you?)”

只不过第一段是西班牙语原声(Qué tal, eh, yo soy Guillermo, ¿Cómo estás?),第二段是标准的人类英语翻译,而第三段则是AI合成的英语翻译,来自于谷歌 AI 最新的语音翻译模型 Translatotron。

该模型是一个基于注意力机制(Attention)的端到端语音翻译神经网络。它不同于传统语音翻译技术,在翻译的过程中省略了中间步骤,完全不需要进行语音转文字和完成翻译的文字转语音,而是根据翻译内容,尝试匹配不同语言的语音频谱图(speech spectrogram),直接完成语音之间的转换。

换句话说,我们刚才听到的第一段西班牙语和第三段英语片段,AI在翻译的过程中,没有使用到任何语音转文字的技术,也没有使用西班牙语和英语的文字翻译技术,只有纯粹的语音转换。

虽然从翻译的准确率来看,Translatotron 模型还比不过传统翻译技术,但这种端到端的联合优化思路确实打破了主流语音翻译技术的基本原理,具有很强的启发性和拓展性。

目前谷歌只使用了西班牙语和英语语音作为概念验证,研究成果以预印本的形式发表在 Arxiv 和谷歌 AI 博客上。

打破常规思路

不同语言之间的语音转文字和翻译,是近年来机器学习领域的热门研究方向,尤其是语音到语音的直接翻译。

通常来讲,语音翻译过程可以分解成三个步骤。

第一步是语音识别,就是将英文语音内容识别出来,并且以文字的形式表达出来,比如听到“How are you?”这句话,就写出 How,are,you 三个单词和问号。

第二步是文字翻译,就是将上一步拿到的文字翻译成目标语种,比如写出“你好吗?”这句话。

最后一步是语音合成,也就是将翻译好的文本组合成一段语音,然后播放出来。

图 | 不同模型从西班牙语到英语的语音翻译对比

谷歌翻译等当下常见的语音翻译软件都遵循了这一思路,并且对每一步骤进行了很多优化,比如引入端到端模型(End-to-end model)。这是一种将三个步骤结合起来,比如建立语音信号到文字映射,进而实现整体优化的模式。

在谷歌研究人员看来,他们提出的 Translatotron,是之前很多端到端研究成果的进一步延伸,可以直接抛弃文字翻译这一中间步骤,成功在神经网络的帮助下,实现了不同语言语音片段的直接转换。

图 | 不同语音的声音频率VS时间热图

他们使用的是一套序列到序列模型(Sequence-to-sequence model),即训练 AI 将有关联的连续数据视为一段整体(英文句子),然后直接转化为另一段不同的整体(中文句子)。

在 Translatotron 中,研究人员选择了语音片段的频谱图作为序列,上面描述了语音频率随时间变化的热图。它们会作为输入值进入到神经网络中,随后经过8层堆叠双向长短时记忆网络(BLSTM)编码器,频谱与自动语音识别特征结合,多头注意力和频谱解码器等多个模块,完成对语音频谱特征的提取,转换和生成等任务。

经过上述一系列转换后,西班牙语语音频谱就变成了对应的英语语音频谱,最后可以通过声码器(vocoder)合成我们听到的语音。如果需要的话,还可以使用额外预训练好的 Speaker 编码器捕捉语音源的声音特点,添加到合成语音当中,让两者听起来更加相似。

图 | Translatotron的工作原理

在训练过程中,Translatotron还使用了多任务学习技巧(multitask learning),引入了四个长短时记忆网络解码器。

上图的辅助识别任务区域(Auxiliary recognition tasks)就是负责在生成目标语种频谱图的同时,也顺便学习一下如何预测语音的因素和文字内容。只不过它们没有被用来进行推理,否则就不是纯语音翻译了。

为了测试翻译质量,研究人员使用了机器翻译评估算法 BLEU,最好成绩达到了基准表现的76%。

他们认为,这一成绩虽然不及主流的传统语音翻译技术,但 Translatotron 作为一个概念验证,足以证明抛弃机器翻译和文字转换的思路行得通,而且可能还在还原音色等方面拥有更大的潜力。

下一步,谷歌团队将尝试降低训练过程中的监督水平,扩大合成数据和多任务学习的规模,并且探索其他可以转移的声音元素,改善合成语音的质量。

不得不说,直接在不同语言之间转换音频的想法还是很有创意的,而且极富挑战性,对特征提取质量,语音频谱绘制和噪声抵抗能力提出了更高的要求,足以启发其他团队,成为一个新的研究方向。

如果你还想听听更多语音的翻译效果,可以访问Demo网站:

https://google-research.github.io/lingvo-lab/translatotron/

谷歌翻译网页更新:新材料设计界面

IT之家11月29日消息 在近几个月的时间里,谷歌全新的材料设计(Material Design)语言已经面向全线产品推出,覆盖网页端和安卓应用端。今日,这一更新又来到了谷歌翻译的网页版上。

和谷歌相册(Google Photos)相似,新版的谷歌翻译界面采用了白色主题色;旧版中的矩形蓝色“翻译”按钮被缩小并改成了圆形,放在了两个翻译文本框中间。此外,谷歌还增加了一个“文档”按钮,支持用户上传文档进行翻译

谷歌还在页面左边设置了侧边栏呼出按钮,并在翻译文本框下方将“历史记录”、“已保存”、“社区”三个入口的按钮突出显示。

这一更新的到来,意味着又一款谷歌产品用上了全新材料设计语言,也让谷歌的这一新设计更具家族气息。

中国大陆用户现在可以毫无障碍地使用谷歌翻译应用程序。

Google 非常低调地宣布了这条消息……

今天,Google 对翻译 app 进行了更新,中国大陆用户现在已经可以使用翻译 app 的完整内容,包括 Word Lens(即时相机翻译)功能。

在 Android 和 iOS 设备上更新至 5.8 版本的 Google 翻译 app 后,用户还可以使用到新增的英语与中文之间的即时相机翻译功能。

Google 表示,在公司部分业务退出中国市场的这些年来,用户依然可以通过 translate.google.cn 在网页端使用 Google 的翻译工具,而从今天开始,用户还可以通过 Android 与 iOS app,体验完整的翻译功能。

除了 Google 翻译 app,Google 翻译在中国还将以多种形式向用户提供帮助,如用户可以访问网页版 Google 翻译,也可以通过 Chrome 直接翻译整个外文网页,与此同时,开发者和企业还能充分利用 Google 翻译 API。

Google 在其 中文博客 中写道,「通过此次更新,Google 希望为中国用户带来更好的翻译体验,突破语言障碍与全球实现互联。」

Google 翻译其实一直都能在中国大陆使用,只不过是 Google 通过 .cn 网站向大陆用户提供,而不是他们的国际站点。

懂点君瞎说:谷歌会不会一点一点一点一点地。。。就回来了?这种大好消息,等啥呢?还不转发?!

本文作者 :

– – – – END – – – –

谷歌离线翻译更准确!更新59种语言,准确率提高12%

▲Google离线翻译更新。(图/翻摄自9to5google)

记者陈心怡/外电报导

Google翻译是许多人生活当中不可或缺的功能,不论出国旅游、看外文文章,它都是最佳助手。日前Google翻译推出更新版,最大特点就是离线翻译功能比以往更加准确。

当你在没网路或网路不稳的情况下,手机处于离线状态,仍然可以在Android和iOS上使用Google翻译,但翻译精准度就不如连线状态来得好。为了改善此情况,Google离线翻译大动作对59种语言进行更新,让整体准确性提高了12%,并且单字、文法和句型结构同样也获得改善。

然而,虽然很难实际量化测量翻译的准确性,但是Google声称在特定的语言(例如日文、韩文,泰文、波兰文和印地文),翻译准确度提高了20%以上。

▲Google翻译更新后能更精准地翻译。(图/翻摄自Google)

最新版的离线翻译可以在Google Translate 6.4中下载。此外,这次更新还新增10种语言的音译支援,包括阿拉伯语,孟加拉语,古吉拉特语,卡纳达语,马拉地语,泰米尔语,泰卢固语和乌尔都语。

如果你不懂元宇宙中的一门外语怎么办?梅塔:这项新技术可以翻译128种语言

作为元宇宙最坚定的支持者之一,Facebook 在上个月宣布改名 Meta,此后便新动作不断,先是推出了一个触觉手套,试图让人们在 VR 世界中也能体验到触觉变化。

触觉之后,Meta 又盯上了语言,它要让人们在虚拟世界中也可以无障碍沟通,哪怕双方使用的语言不同,你说英语,我说中文都能互相理解。

就这样 XLS-R 来了,它是 Meta 最近发布的一个 AI 语言处理模型,最高能识别 128 种语言,目前已经公布了网页体验版。

▲ XLS-R 网页体验版仅支持语音输入

体验版的功能有一定缺失,仅支持将 22 种语言翻译为 16 种语言,我试了下最常见的英译中,一段 7 秒左右英文语音,XLS-R 还是能相对准确地识别,中文翻译和英文识别都基本正确,两者耗时都在 1.4 秒 左右,并不算短。

对比市面上常见语音翻译应用,这个速度和转译表现其实中规中矩,都对口语清晰度有要求,一旦语速稍微快一些,就比较难理解,转译会出错。

XLS-R 的潜力体现在多语言通用 AI 模型上,据 Meta 该技术基于 wac2vec 2.0 预训练模型,能将语音拆成拆成 25 毫秒的基本单元来分析,利用上下文转换语音内容,提升识别准确度。

言,转换准确率提升了不少,经过通过 436000 小时的公开录音训练后,才有如今的 XLS-R。

▲XLS-R 识别单词错误率更低

XLS-R 仅仅用一种语言模型就可以转换 128 种语言,和特殊领域使用特殊模型的常见做法不同,极大地提升了通用性。在官方博客中,Meta 表示它们的目标是用单一模型识别全球 7000 多种语言,从而改进转换算法。

这是一个新的开始,离真正成为 Meta 所设想的虚拟世界基础组成部分还比较难,这不仅仅和技术有关,设备算力也是限制。

作为同在在自然语言识别领域拥有大量技术储备的 Google,其实比 Meta 更早在消费级设备上支持多语种翻译功能,Pixel 6 系列支持 live Translate 功能,可以在聊天软件中进行翻译,无障碍地与外语朋友交流。

只是 live Translate 功能支持的语言并不算多,主要还是英语、德语、日语之间的翻译,哪怕 Pixel 6 所使用的 Tensor 芯片在 AI 性能方面已经是冠绝全球,达到了骁龙 888+ 的三倍。

只有联网 live Translate 功能才能做到支持 48 种语言,而使用云计算技术的 Google 翻译也仅支持 108 种语言,离 7000 种语言很远。

元宇宙离我们仍然有一段距离,不过 XLS-R 等技术作为 Meta 口中虚拟世界的基础建设之一,或许能在其他领域发挥作用,现在它已经发布了 XLS-R 预训练模型的微调教程,让业内人士可以基于它进行微调以便应用到具体的工作当中。

或许不久之后,我们能看到越来越多的应用支持更多语种的语音转译功能。

谷歌浏览器如何开启自己的翻译功能

【谷歌浏览器技能篇】

相信大家对于谷歌浏览器的翻译功能并不陌生吧!但突然有一天这个功能不能用了,不要慌,一定要稳住细心思考,方能解决问题。下面我就来介绍一下不能用的谷歌翻译功能是如何开启的。

Ⅰ、双击打开电脑桌面上已经安装好的谷歌浏览器

Ⅱ、在谷歌浏览器界面中,右上角找到有三个点的图标,单击它,在下拉菜单中,找到设置选项单击进入。

Ⅲ、在打开的设置界面中,依次点击高级—语言选项

Ⅳ、在语言设置选项中,将“询问是否翻译非您所用语言的网页”这一项的按钮设置为开启的状态。

Ⅴ、设置完成之后,我们可以找一个全英文的网页来测试一下 。当我们输入网址进入全英文网页的时候,谷歌翻译就会有提示了“是否要翻译”。出现这个提示我们可以判断翻译功能已经生效。

Ⅵ、但有的时候由于谷歌版本的不同,一顿操作之后,翻译的图标还是不显示,那又该怎么办呢?同样不要着急,问题总有解决的方法。之后我们一起来见证一下,到底是如何解决的。

【在打开网页的任意处右键,在下拉菜单中,找到翻成中文(简体)并单击它,此时就可以成功翻译了。】

最后总结一下,为了避免出错,最好是将我们电脑里面的谷歌浏览器更新到最新的版本。

Google Translate已经在play store上安装了超过10亿次

谷歌翻译(Google Translate)是线上翻译应用中最古老的服务之一,它为世界各国民众解决语言鸿沟问题做出了极大的贡献。随着时间的推移,谷歌翻译一直在不断改进,从原先的网页服务扩展到iOS/Android手机端,在不断提高准确率的同时推出了新功能和简化的界面。

Google的这些投入显然已经得到了回报,因为该应用在Play Store上的下载量刚刚超过10亿次。

Google Translate现在可以翻译108种语言,并内置了许多方便的功能, 例如提供实时转录和黑暗模式都是近期刚出现的。

Google Translate应用在旅行时也特别方便这要归功于它的离线翻译模式,它的语音功能还可以帮你准确念出外国名字,相机翻译功能更是可以让街道和文本上的内容迅速变成熟悉的语种。

Google Translate每天处理超过1000亿个单词,在这个过程中,用户实际上就在帮助它改进翻译并提供最佳体验。

愤怒谷歌翻译羞辱中国

作者/金子女侠

风云突变,病毒新冠,

南非变种,世界色变。

欧洲股市,惨遭重挫,

原油价格,跌势连连。

大疫之下,前景不明,

有人劫掠,有人发难。

前有美国,围堵中国,

今有谷歌,翻译辱华。

昨日微博,登上热搜,

网友发现,谷歌翻译,

艾滋病人,竟成“武汉人”!

技术错误?

非也!

用词测试,新闻仍是翻译成新闻。

唯独“艾滋病人”,无论何种语言,仍是翻译成“武汉人”!

如此看来,并非技术出错,实属技术使然。

谷歌公司,是用翻译技术,夹带私货,暗中恶毒攻击中国!

真真是恶心他妈给恶心开门,恶心到家!

是可忍,孰不可忍。

谷歌如何作答?

昨晚十点,谷歌官微,发文回应:

“我们已经了解到Google翻译出现的问题并正在解决。”

没有解释,没有道歉,轻描淡写,傲慢至极!

十一年前,谷歌为何退出中国?

违背法律,名为退出,实为驱逐。

前有谷歌搜索,今有谷歌翻译。

侮辱中国,不作不死。

无知不是生存的障碍,傲慢才是!

美国扼华,生物战在前,污名化在后。

从华盛顿到美企,从文化到意识,对华恶意,无处不在。

一边把自己包装成白莲花,一边又在全世界无恶不作。

这就是美国!

没有谁是不可替代。

没有谁一边辱华,还能在华捞钱。

谷歌翻译,一词相赠:

滚出中国!

女侠执剑,毒舌心善。作者简介:金子女侠,爱宅的成都姑娘,媒体撰稿人。立足热点,嬉笑怒骂皆文章,行藏去留尽话题。欢迎关注作者微信公众号:金子多(ID:jinziduo66)

没看够?赶紧关注我吧!

谷歌像素6系列支持本地实时字幕翻译,张量芯片的威力开始显现

IT之家 8 月 3 日消息 谷歌官方今日凌晨正式官宣了 Pixel 6 与 Pixel 6 Pro 两款“亲儿子”手机,搭载谷歌自家的 Google Tensor 芯片,将在今年秋季发布。

据《华盛顿邮报》报道,谷歌 Pixel 6 系列将支持实时翻译字幕。

外媒 The Verge 的 Dieter Bohn 在体验了该功能后表示:“Pixel 6 上的自动翻译字幕似乎更快、更准确 —— 甚至能够实时将视频中的法语翻译成英语。”

得益于谷歌最新公布的 Google Tensor 芯片,自动翻译字幕将会在手机本地完成,无需进行联网翻译,谷歌硬件主管 Rick Osterloh 表示,Tensor 芯片允许 Pixel 6 手机运行“数据中心质量模型(data-center quality models)”。

IT之家了解到,谷歌 Pixel 6/Pro 手机将于今年秋季发布,各有三种配色,采用三段式背部设计,摄像头模组凸起(被人们戏称“防爆盾”)。

Tensor 芯片可以直接在手机上处理 AI 和 ML 模型,为相机、语音识别和其他功能提供更好的体验。官方强调了语音助手、翻译、字幕和听写能力,预计在这些方面会有较大提升。

相关阅读:

《谷歌 Pixel 6/Pro 手机官宣:搭载 Google Tensor 芯片,将于秋季发布》

《谷歌宣布首颗自研手机芯片 Tensor :历时 4 年,要彻底改变智能手机》

谷歌翻译故意羞辱中国?大量词语恶意攻击中国,网民们愤怒:我们必须道歉

一些反华势力攻击中国的手段愈发阴暗肮脏!日前,在社交平台,许多网友发现,谷歌翻译英文翻中文程序被故意设置成了“辱华渠道”,即在英文对话框中输入与“艾滋病”相关的词汇,对应的中文对话框中便会出现一系列攻击中国的内容。这令中国网友极其愤慨,直呼“恶心”。

据环球网报道,11月26日,许多网友在微博上反映,谷歌翻译英翻中程序涉嫌辱华,如在英文对话框中输入“艾滋病人”,对应中文翻译显示的竟然是“武汉人”。网友经过测试还发现,在英文对话框中输入与“艾滋病”相关的其他词汇,对应中文翻译便会显示一系列与中国相关的内容,以此来恶毒攻击中国。测试还发现,在俄语翻译中文程序中输入“艾滋病人”,对应中文翻译也会显示“武汉人”。

如此阴恶手段令人作呕,这显然不是程序出现偶然性错误,而是有人故意为之。许多网友气愤声讨,要求谷歌翻译必须给个说法,必须道歉。有网友谴责谷歌“恶心”、“过分”、“犯了什么大病”,怒斥其“夹带私货”、“暗戳戳玩手段”。

一些网友认为,出现这种情况极可能是有大量用户人为对翻译结果进行了更改,而谷歌对用户修改翻译结果缺乏人工审核环节,所以被修改过的攻击中国的内容会自动入库。按照这个分析,这就是一些反华势力有组织的行为,不过,归根结底,谷歌翻译也逃不脱责任。

26日18时左右,“安徽团省委”官方微博也发声,要求谷歌翻译作出解释。晚上22时左右,谷歌官方微博“Google黑板报”发文称,已经了解到谷歌翻译出现的问题,正在解决。大约一小时后,“Google黑板报”再次发文称,目前问题已解决,谷歌翻译是一个自动翻译器,通过已有的翻译模式为用户寻找最佳翻译,但一些模式会导致错误的翻译,谷歌翻译在发现后立即修复了这一问题。

不过,对于谷歌翻译的回应,网友并不买账。有网友表示,这并非是谷歌翻译自己发现的,而是大家举报后才修改的;还有网友表示,将所有问题都推给了翻译机制,道歉在哪里?有网友提到,自己之前也遇到过类似情况,并质问西方人所谓的文明与素质何在?

实际上,此前,谷歌翻译也出现过类似情况,在中译英程序中输入“中国台湾”便会出现“台独”内容;而在英译中系统中,输入一些负面语言或者脏话,对应中文翻译便会出现辱华内容。当时在收到大量网友投诉后,谷歌更正了翻译结果,并承诺会持续“改良”翻译结果,但如今类似令人气愤的情况又出现了。所谓“模型错误”根本不能成为理由,这只能说明谷歌翻译并没有努力去避免“模型歧视”,而深层次的原因则是其公司文化中就根植着歧视之源。

值得一提的是,2010年,谷歌退出中国内地市场,其违背进入中国市场时的承诺,宣布停止对谷歌中国搜索服务进行“过滤审查”,还借黑客攻击问题影射指责中国。当时,中方曾强调,外国公司在华经营,就必须遵守中国法律。

西方一些媒体与平台,打着“自由”的旗号,实际干的却是不入流之事,炮制、传播错误信息,误导蒙蔽公众。一些反华势力背地里搞这种龌龊邪恶伎俩,真是为人不齿,这也充分说明,反华是没有出路的,那些卑鄙之人只能躲在阴暗的角落里。

(编辑:TSN)