谷歌深入印度市场,并提供了一系列措施,以更好地服务于世界第二大互联网市场

目前印度有超过 6 亿互联网用户,但其中只有一小部分人能够流利说英语。然而,目前印度大多数在线服务和网页服务都只提供英语。这种语言障碍造成了全球第二大互联网市场的数字鸿沟,从而让数亿用户只能使用少数网站和服务。

因此,越来越多的科技企业尝试为更多的印度人提供互联网服务。本周四谷歌宣布了一系列措施,在旗下产品中更多地使用印度当地语言之外,还提供了全新的语言翻译方法。

此外,谷歌表示计划投资谷歌在印度的研究中心,推动机器学习和人工智能领域的发展,并将人工智能模型在整个生态系统中向所有人开放。谷歌承诺将会在未来几年在印度投资 100 亿美元,并和当地的创业公司进行合作,用当地语言为印度用户提供服务,并大幅改善谷歌产品和服务体验。

除了目前可用的英语和印度语之外,谷歌还将会看到泰米尔语、泰卢固语、孟加拉语和马拉地语的查询搜索结果。这一新增功能是在谷歌在印度的搜索页面中增加印地语标签四年后推出的。该公司表示,在推出这个标签页后,印地语的搜索查询量增长了10多倍。例如,如果有人更喜欢看到他们的泰米尔语查询,现在他们将能够在英语旁边设置泰米尔语标签,并在两者之间快速切换。

获得本地语言的搜索结果是很有帮助的,但人们往往也想用这些语言进行查询。谷歌表示,它发现用非英语语言输入是目前用户面临的另一个挑战。为了解决这一挑战,搜索将开始在适当的情况下以支持的印度语言显示相关内容,即使当地语言查询是用英语输入的。该公司计划在下个月推出该功能,支持五种印度语言:印地语、孟加拉语、马拉地语、泰米尔语和泰卢固语。

谷歌还让用户更容易快速改变他们在应用程序中看到结果的首选语言,而无需改变设备的语言设置。该功能目前在Discover和Google Assistant中提供,现在将在 Google Maps 中推出。同样,Google Lens的 “家庭作业 “功能,允许用户对数学或科学问题进行拍照,然后提供其答案,现在支持印地语。

谷歌高管还详细介绍了一个新的语言人工智能模型,他们称之为印度语言的多语言表示(MuRIL),在处理翻译、拼写变化和混合语言以及其他语言的细微差别方面提供更高的效率和准确性。Google Research India的研究科学家Partha Talukdar周四在一次虚拟活动中表示,MuRIL在使用罗马字母书写印地语时提供了对译文的支持,这是以前的同类模型所缺少的东西。

该公司表示,它用维基百科上的文章和来自一个名为Common Crawl的数据集的文本来训练新模型。它还对来自维基百科等来源的翻译文本进行了训练(通过谷歌现有的神经机器翻译模型进行反馈)。结果是,MuRIL处理印度语言的能力比之前更通用的语言模型更好,可以应对已经被翻译的字母和单词–也就是说,谷歌使用的是不同字母或文字的最接近的对应字母。

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据