谷歌的技术工作ar翻译眼镜:其实没那么简单

梦想是好事,但谷歌翻译也有自己的核心挑战

在周三的 I/O 演示结束时,谷歌推出了一个“还有一件事”式的惊喜。在一段简短的视频中,谷歌展示了一副增强现实眼镜,它有一个目的——在你的眼球前显示可听的语言翻译。在视频中,谷歌产品经理 Max Spear 将这个原型的能力称为“世界字幕”,我们看到家庭成员第一次交流。

现在等一下。像许多人一样,我们以前使用过谷歌翻译,并且在很大程度上认为它是一个非常令人印象深刻的工具,它恰好会造成很多令人尴尬的失误。虽然我们可能相信它可以为我们提供前往公共汽车的路线,但这与相信它能够正确解释和传达我们父母的童年故事相去甚远。谷歌之前不是说它终于打破了语言障碍吗?

2017 年,谷歌将实时翻译作为其原始 Pixel Buds 的一项功能进行营销。我们的前同事肖恩·奥凯恩(Sean O'Kane )将这次经历描述为“一个值得称赞的想法,但执行力却很可悲”,并报告说,与他一起尝试过的一些人说,这听起来就像他是一个 5 岁的孩子。这并不是谷歌在其视频中所展示的。

此外,我们不想忽略 Google 承诺这种翻译将在一副 AR 眼镜中进行的事实。不要打痛处,但增强现实的现实甚至还没有真正赶上谷歌十年前的概念视频。你知道吗,它是备受诟病且佩戴尴尬的谷歌眼镜的前身?

公平地说,谷歌的 AR 翻译眼镜似乎比 Glass 试图完成的更专注。从谷歌展示的情况来看,它们的目的是做一件事——显示翻译文本——而不是充当可以取代智能手机的环境计算体验。但即便如此,制作 AR 眼镜也并非易事。即使是适度的环境光也会使在透视屏幕上查看文本变得非常困难。在阳光透过窗户发出眩光的情况下阅读电视上的字幕已经足够具有挑战性了;现在想象一下那种体验,但被绑在你的脸上(并且与你自己无法理解的人进行对话的额外压力)。

即使是适度的环境光也会使在透视屏幕上查看文本变得非常困难

但是,嘿,技术发展很快——谷歌或许能够克服阻碍其竞争对手的障碍。这不会改变谷歌翻译不是跨语言对话的灵丹妙药这一事实。如果您曾经尝试过通过翻译应用程序进行实际对话,那么您可能知道您必须慢慢说。并且有条不紊。而且很清楚。除非你想冒险翻译乱码。一句口误,你可能就完蛋了。

人们不会像机器那样在真空中交谈。就像我们在与 Alexa、Siri 或 Google Assistant 等语音助手交谈时进行代码转换一样,我们知道在处理机器翻译时必须使用更简单的句子。即使我们说话正确,翻译仍然会显得尴尬和误解。我们的一些精通韩语的Verge同事指出,谷歌自己的 I/O 前滚动倒计时显示了一个没有人实际使用的韩语“欢迎”的敬语版本。

根据Rami Ismail和Sam Ettinger的推文,谷歌在其翻译演示文稿中在幻灯片上显示了超过六个倒退、损坏或其他不正确的脚本,这种轻微令人尴尬的失误相形见绌。(Android Police指出,谷歌员工已经承认了这个错误,并在 YouTube 版本的主题演讲中得到了纠正。)要明确的是,这并不是我们期望完美——但谷歌试图告诉我们它接近于破解真实时间翻译,而那些错误使这看起来难以置信。

谷歌正试图解决一个极其复杂的问题。翻译单词很容易;弄清楚语法是困难的,但可能的。但语言和交流远比这两件事复杂得多。作为一个相对简单的例子,A​ntonio 的母亲会说三种语言(意大利语、西班牙语和英语)。她有时会在句子中间借用不同语言的单词——包括她的地方意大利方言(就像第四种语言)。这种类型的东西对人类来说相对容易解析,但谷歌的原型眼镜可以处理吗?不要介意谈话中比较混乱的部分,例如不明确的参考资料、不完整的想法或影射。

谷歌正试图解决一个极其 复杂的问题

并不是说 Google 的目标不值得钦佩。我们绝对希望生活在这样一个世界,每个人都可以体验视频中的研究参与者所做的事情,当他们看到亲人的话出现在他们面前时,他们会睁大眼睛惊奇地盯着。打破语言障碍并以我们以前无法做到的方式相互理解是世界更需要的事情;只是在我们到达那个未来之前还有很长的路要走。机器翻译就在这里,并且已经存在了很长时间。但是,尽管它可以处理过多的语言,但它还不会说人类。

发表评论

您的电子邮箱地址不会被公开。

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据