艾知道这幅画,驴子的嘴唇不对,马的嘴不对?Google AI:使用隔行训练集提高图像描述的准确性

来源:Google AI Blog

编辑:好困

【新智元导读】图像描述是计算机视觉、自然语言处理和机器学习的综合问题。近日,谷歌AI提出了一个新的训练集,可以有效提升图像和文本语义匹配的相似性。

如果一张图片可以用一千个单词描述,那么图片中所能被描绘的对象之间便有如此多的细节和关系。我们可以描述狗皮毛的质地,要被追逐的飞盘上的商标,刚刚扔过飞盘的人脸上的表情,等等。

现阶段,包含文本描述及其相应图像的描述的数据集(例如MS-COCO和Flickr30k)已被广泛用于学习对齐的图像和文本表示并建立描述模型。

然而,这些数据集的跨模态关联有限:图像未与其他图像匹配,描述仅与同一张图片的其他描述匹配,存在图像与描述的匹配但未被标记为匹配项,并且没有标签标明何时图像与描述之间是不匹配的。

为了弥补这一评估空白,我们提出了「交叉描述:针对MS-COCO的扩展的模内和模态语义相似性判断」。

纵横交错描述(CxC)数据集使用图像-文本,文本-文本和图像-图像对的语义相似性评级扩展了MS-COCO的开发和测试范围。

评级标准基于「语义文本相似性」,这是一种在短文本对之间广泛存在的语义相关性度量,我们还将其扩展为包括对图像的判断。我们已经发布了CxC的评分以及将CxC与现有MS-COCO数据合并的代码。

创建CxC数据集

CxC数据集扩展了MS-COCO评估拆分,并在模态内和模态之间具有分级的相似性关联。鉴于随机选择的图像和描述匹配的相似性不高,我们提出了一种方法来对项目进行选择,通过人工评级从而产生一些具有较高相似性的新匹配。为了减少所选匹配对用于查找它们的模型的依赖性,我们引入了一种间接采样方案,其中我们使用不同的编码方法对图像和描述进行编码,并计算相同模态项匹配之间的相似度进而生成相似度矩阵。图像使用Graph-RISE嵌入进行编码,而描述则使用两种方法进行编码-基于GloVe嵌入的通用语句编码器(USE)和平均单词袋(BoW)。

由于每个MS-COCO示例都有五个辅助描述,因此我们平均每个辅助描述编码以创建每个示例的单个表征,从而确保所有描述对都可以映射到图像。

上:使用平均辅助描述编码构造的文本相似度矩阵(每个单元格对应一个相似度分数),每个文本条目对应于单个图像。下:数据集中每个图像的图像相似度矩阵。

我们从文本相似度矩阵中选择两个具有较高计算相似度的描述,然后获取它们的每个图像,从而生成一对新的图像,这些图像在外观上不同,但根据描述的相似。

例如,「一只害羞地向侧面看的狗」和「一只黑狗抬起头来享受微风」具有相当高的模型相似性,因此下图中两只狗的对应图像 可以选择图像相似度等级。此步骤也可以从两个具有较高计算相似度的图像开始,以产生一对新的描述。

上:根据描述相似度来选择图像匹配。下:根据描图像的相似度来选择描述匹配。

通过使用现有的图像标题对在模态之间进行链接来做到这一点。例如,如果人对一个描述匹配样本ij的评级为高度相似,我们从样本i中选择图像,并从样本j中选择描述,以获得一个新的用于人工评级的模态内匹配。然后,我们使用具有最高相似性的模态内对进行采样,这可以包括一些具有高度相似性的新匹配。

不同相似度的语义图像相似性(SIS)和语义图像文本相似性(SITS)示例,其中5为最相似,0为完全不相似。

评估

MS-COCO的匹配是不完整的,因为有时为一幅图像的描述同样适用于另一幅图像,但这些关联并未记录到数据集中。CxC使用新的正向匹配增强了这些现有的检索任务,并且还支持新的图像-图像检索任务。

通过其相似度的评级判断,CxC还可以测量模型和人工评级之间的相关性。不仅如此,CxC的相关性分数还考虑相似度的相对顺序,其中包括低分项(不匹配项)。

我们进行了一系列实验,以展示CxC评级的效用。为此,我们使用基于BERT的文本编码器和使用EfficientNet-B4作为图像编码器构造了三个双编码器(DE)模型:

1. 文本-文本(DE_T2T)模型,双方使用共享的文本编码器。

2. 使用上述文本和图像编码器的图像文本模型(DE_I2T),且在文本编码器上方有一个用来匹配图像编码器输出的层。

3. 在文本-文本和图像-文本任务的加权组合上训练的多任务模型(DE_I2T + T2T)。

文本-文本(T2T),图像-文本(I2T)和多任务(I2T + T2T)双编码器模型的CxC检索结果

从检索任务的结果可以看出,DE_I2T + T2T(黄色条)在图像文本和文本图像检索任务上的性能优于DE_I2T(红色条)。因此,添加模态内(文本-文本)训练任务有助于提高模态间(图像-文本,文本-图像)性能。

相同模型的CxC相关结果

对于关联任务,DE_I2T在SIS上表现最好,而DE_I2T + T2T在总体上是最好的。相关分数还显示DE_I2T仅在图像上表现良好:它具有最高的SIS,但具有更差的STS。

添加文本-文本损失到DE_I2T训练中(DE_I2T + T2T),可以使整体性能更加均衡。

参考资料:

https://ai.googleblog.com/2021/05/crisscrossed-captions-semantic.html

https://arxiv.org/pdf/2004.15020.pdf

安全专家说,最近流行的人口贩运网络钓鱼信息旨在窃取受害者的谷歌账户

近段时间,许多美国人都受到了自称来自美国邮政局(USPS)的诈骗短信。一些专家分析后认为,幕后很可能是 QAnon 组织在捣鬼。从安全研究员 Eric JN Ellason 等人在 Twitter 上分享的截图来看,阴谋策划的这波钓鱼诈骗,甚至谎称当事人涉嫌人口贩运等事件。然而从指向 m9sxv.info(从定向至 jtuzd.rdtk.io)的链接来推测,其似乎旨在窃取受害者的凭证信息。

早在 9 月 1 日,一位拥有 5000 名粉丝的 Instagram 用户发布了一张短信界面截图。发信人宣称用户收到了一个 USPS 包裹,并且附上了一条奇怪的链接。

点击之后,钓鱼网站又会跳转到新的网址,提示用户的包裹存在问题,然后引导受害者到“包裹追踪”页面。

钓鱼域名示例

钓鱼信息还宣称有追踪非法性交易的新方法,结果引发了许多网友对其阴谋的讨论,最终迫使打击跨国人口贩运的非盈利组织不得不发表一份声明来澄清。

钓鱼网站示例

Polaris 在声明中称,该组织已经收到了许多涉及 USPS 钓鱼短信的人口贩运举报。在感谢网友们的热心之余,该组织还是希望大家能够对此类信息加以甄别,以抑制虚假信息的传播。

钓鱼诈骗似乎意在窃取用户的谷歌账户登陆凭证

对于 Polaris 这样的非盈利组织来说,蜂拥而至的虚假消息会造成本就有限的资源被无谓消耗,导致真正等待被解救的人们难以与之取得安全地联系。

早前的一个钓鱼诈骗示例

Google play mall测试“比较”功能:它可以直观地比较类似的应用程序

目前我们在下载应用程序的时候,很多情况下都是根据其他用户评论、应用简介、图片等信息进行导航,有时候会下载多款同类型应用从而挑选出最适合自己的。不过,Google Play 应用商城近日正在尝试一项新的变化,能够直接对相似应用进行比较,从而方便用户更快地找到合适的应用。

目前谷歌已经邀请部分 Play 商城用户进行体验,在应用页面底部会有“Compare apps”(对比应用),不过目前仅限于一些主流的媒体播放器。当它出现时,它将显示与当前列表类似的流行应用,并根据易用性以及它们是否支持脱机播放和投屏等功能进行比较。

Play 商城上拥有庞大的应用数量,如何让用户发现和体验新应用是值得重点思考的问题。此前谷歌已经做出了诸多尝试,包括为游戏提供应用预览等等。而通过直观的同类应用规格比较,能够让用户更好的根据需求挑选适合自己的应用程序。

Iqoo Neo系列新机器出现在Google play上,配备snapdragon 888和12gb内存

IT之家 12 月 3 日消息,Google Play 控制台上列出了正在开发中的 iQOO Neo 系列新机,该设备型号为 vivo V2154A。

根据曝光的信息,iQOO Neo 系列新机搭载骁龙 888 处理器,配备 12GB 内存,运行 Android 11 系统。从曝光的外观图可以看到,iQOO Neo 系列新机配备居中挖孔曲面屏。

IT之家了解到,此前该机已通过 3C 认证,支持 66W 快充。

数码博主 @数码闲聊站 此前爆料,iQOO Neo 系列一款新机将搭载骁龙 888 处理器,拥有 4500mAh 电池,支持 66W 双芯闪充。该新机还将配备 OLED 屏幕,支持 120Hz 刷新率,拥有 48MP 摄像头。

另一款新机则会搭载骁龙 778G 处理器,同样支持 66W 充电。

Google play将添加一个新的安全区:澄清应用程序收集的数据及其原因

Google即将对 Google Play 应用商城的政策进行优化,以便于 Android 用户更容易看到和理解所有安全功能对他们意味着什么。在即将生效的开发者政策中,Play Store 的所有 APP 页面将提供专门的数据隐私和安全部分。

该部分将使用易于理解的语言解释应用如何收集数据,以及开发者如何处理这些数据。该区域显示的内容并不是空洞的隐私安全保护条款,而是更实际的收集内容。该部分还将列出该应用程序实施的安全功能,如数据加密或Google的家庭政策。通过这个区域的描述,能够帮助用户决定是否信任并下载该应用。该区域能够更真实还原应用的数据收集情况,即便是关闭数据收集选项某些 APP 依然会收集一些数据,而这些行为会在该区域内显示出来。

当然,这不会立即发生,开发者将被要求提交与这些隐私政策有关的信息。他们在提交新的应用程序或应用程序更新时将不得不填写一份调查问卷。即使是不收集数据的应用程序也将被要求附上这些信息。

Google给了开发者充足的时间来准备这一变化,这一变化要到2022年4月才会严格执行。从今年10月开始,开发者可以开始回答调查问卷。新的 “应用程序隐私与安全 “部分将出现在Google Play的所有用户中。Google警告说,不遵守这一新要求将意味着新的应用程序提交或更新将被直接拒绝,直到问题得到解决。

谷歌:开发者可以申请更多时间来完成谷歌支付政策合规性

IT之家 7 月 20 日消息 今日,谷歌 Android 开发者官方表示,开发者可申请更多时间完成 Google Play 付款政策合规。

去年 9 月,谷歌对付款政策进行了阐述,明确给出了开发者采用 Google Play 结算系统的时间要求。彼时,谷歌为开发者提供了一年的时间来实施更新。

谷歌今日指出,在考虑了来自不同团队规模的开发者反馈后,其为开发者提供延期 6 个月的申请选项,即可以将付款政策的合规截止日期推迟至 2022 年 3 月 31 日。

IT之家了解到,从 7 月 22 日开始,开发者可以通过帮助中心申请延期。

Google play升级支付方式:添加多笔购买/多行订阅等

虽然 Google Play 并非是 Android 平台上唯一的应用商城,但在应用规模上无疑是最大的。目前 Google Play 拥有将近 200 万款应用程序,该平台也适合微交易和购买,包括游戏、应用程序和其他服务。现在,谷歌宣布为那些开发付费应用的开发者提供全新的方式,为应用和订阅提供全新的支付方式。

在 2021 年的 I/O 开发者大会上,谷歌计划为 Google Play 商城提供几项新的功能。其中包括多数量购买(multi-quantity purchases),也就是说允许在一个应用程序中一次性从购物车中购买一个以上的商品。

此外,谷歌还计划推出多线订阅(multi-line subscriptions)功能,允许你在一个单一的订阅中销售多种产品。另一个新功能就是只允许用户在固定的时间段内访问某些内容。这将为开发者和用户提供更多的选择,以确定他们想支付什么和如何支付。

谷歌表示,这些功能将在Google Play Billing Libray 4.0版本中提供,现在已经可以供开发者实施。同时,更新应用程序的窗口期很短;现在要求新的应用程序在8月2日之前整合计费库版本。

2021谷歌播放最佳应用程序列表发布

本周一,Google Play 宣布了 2021 年度最佳榜单,并对平板电脑、Wear OS 和 Google TV 的顶级应用和游戏进行了细分。在官方公告中写道:“这一年,我们已练就波澜不惊的本领,学会了泰然面对打破预期的事物。在这期间,这些令人惊艳的应用协助我们安定心神、尽情追逐创意以及寻找灵感。它们就是我们甄选出的 2021 年度 Play 最佳应用”。

和去年的获奖榜单类似,今年的最佳榜单中专注于个人成长的应用很多。今年的获奖者找到了创造性的、通常是冥想性的方法,帮助用户在更深层次上了解自己。获得2021年最佳应用奖的Balance鼓励人们通过个性化的冥想找到自己的中心;Moonly根据农历提供提示和指导;Laughscape帮助人们通过笑声达到冥想的状态。

美国地区榜单如下:

2021年最佳用户选择

应用: Paramount+

游戏: Garena Free Fire MAX

最佳应用

● Balance

最佳游戏

● Pokémon UNITE

年度最受欢迎应用程序

● Empathy

● Mentor Spaces

● Speechify

年度最佳生活帮手应用程序

● Blossom

● PhotoRoom

● Rabit

年度最具娱乐性应用程序

● Clubhouse

● Noobly

● Whatifi

年度最具潜力应用程序

● Laughscape

● Moonbeam

● Moonly

年度最佳自我提升应用程序

● Balance

● Clementine

● Uptime

年度最佳平板电脑应用程序

● Canva

● Concepts

● Houzz

年度最佳穿戴装置应用程序

● Calm

● MyFitnessPal

● Sleep Cycle

年度最佳 Google TV 应用程序

● Disney+

● ESPN

● Tubi

游戏榜单

最佳竞技游戏

● League of Legends: Wild Rift

● MARVEL Future Revolution

● Pokémon UNITE

● Rogue Land

● Suspects: Mystery Mansion

最具颠覆性游戏

● Inked

● JanKenUP!

● Knights of San Francisco

● Overboard!

● Tears of Themis

最佳独立游戏

● 7 Billion Humans

● Bird Alone

● Donut County

● My Friend Pedro: Ripe for Revenge

● Puzzling Peaks EXE

最佳休闲游戏

● Cats in Time

● Crash Bandicoot: On the Run!

● Disney POP TOWN

● Switchcraft

● Towers

最佳平板游戏

● Chicken Police — Paint it RED!

● League of Legends: Wild Rift

● My Friend Pedro: Ripe for Revenge

● Overboard!

● The Procession to Calvary

2021年度谷歌游戏的最佳游戏是“鲍克梦幻聚会”

IT之家 11 月 30 日消息,谷歌最新公布了 Google Play 2021 年度最佳游戏,由《宝可梦大集结(Pokémon UNITE)》获得该奖项。

《宝可梦大集结》的制作人 Masaaki Hoshino 致获奖感言:

我们试图从 MOBA 类游戏中提取出最好的部分来创造一个新游戏,但我必须承认,我不确定它是否会受到全球玩家的欢迎。而 Google Play 年度最佳游戏奖表明,我们的游戏受到了玩家和媒体的欢迎,这激励我们要继续努力,让《宝可梦大集结》有更加激动人心的体验,满足我们的玩家们的期望。

IT之家了解到,Google Play 公布的最佳竞技游戏共有五个,分别为:《英雄联盟:狂野裂谷(League of Legends: Wild Rift)》、《漫威未来革命(Marvel Future Revolution)》、《宝可梦大集结(Pokémon UNITE)》、《流氓土地(Rogue Land)》、《嫌疑人:神秘大厦(Suspects: Mystery Mansion)》。