注入注意力,准确率提高30%!谷歌发布了最新的多目标“动态matting”模型

丰色 发自 凹非寺量子位 报道 | 公众号 QbitAI

只需第一帧图像+边界提示,就能将视频中各物体“抠”出来并进行轨迹跟踪

以上就是谷歌的最新研究成果。

该方法通过在视频中引入注意力机制,成功地解决此前采用了无监督学习的多目标分割和跟踪方法的一些不足。

现在的它,不仅可以泛化到更多样、视觉上更复杂的视频中,还能处理更长的视频序列。

通过实验还发现,相比此前的模型,谷歌这个新方法在MOVi数据集上的mIoU直接提高了近30%

为“动态抠图”引入注意力机制

方法被命名为SAVi(Slot Attention for Video)。

而此前的无监督目标分割和跟踪方法最大的问题,就是只能应用到非常简单的视频上。

为了处理视觉效果更复杂的视频,SAVi采用弱监督学习

(1)以光流(optical flow)预测为训练目标,并引入注意力机制;

(2)在第一帧图像上给出初始提示(一般是框出待分割物体,或者给出物体上单个点的坐标),进行分割指导。

具体来说,受到常微分方程的“预测-校正器”方法的启发,SAVi对每个可见的视频帧执行预测和校正步骤。

为了描述视频物体随时间变化的状态,包括与其它物体的交互,SAVi在进行光流预测时在slot之间使用自注意力

slot就是指视频中各物体,用不同颜色区分。

校正阶段,带有输入的slot-normalized交叉注意用于校正(更新)slot表示集。

然后预测器的输出根据时间来初始化矫正器,使模型最终能够以一致的方式随时间跟踪物体。

△ SAVi模型架构图

在训练中,每个视频被分成六个6帧子序列,第一帧接收提示信号,每帧两轮slot注意力。

在完全无监督视频分割中,研究人员以64的batch size训练了十万步。

没有提示,也能进行简单视频的分割和跟踪

在CATER数据集上,测试表明,SAVi架构完全适用于无监督的物体表示学习。

在光流条件监督的情况下,SAVi在MOVi数据集上获得72.1%的mIoU,比基线模型CRW和T-VOS分别高了近30%和近20%

SAVi在MOVi++数据集上的mIoU得分为45.9%,比T-VOS略高一点,比CRW低了5%。

另外,还可以看到,在第一帧图像上给出质心形式的提示效果会比边界框好一点,但区别不大。

值得注意的是,即使没有任何提示,该方法也能分割一些具有简单纹理的动态场景,比如在数据集Sketchy上。

不过,在将SAVi完全用于现实世界里的复杂视频时,还有一些挑战需克服:

1、所采用的训练方法假设在训练时光流信息是可用的,而在真实视频中,这不一样有;

2、研究中所涉及的都是一些简单物体的基本运动,现实远比这个复杂

最后,作者表示,SAVi在分割和跟踪方面仍然表现出色,在第一帧给出提示信息的做法也可能会衍生出各种相关的半监督方法。

论文地址:https://arxiv.org/abs.2111.12594

参考链接:[1]https://slot-attention-video.github.io/(代码即将开源)[2]https://www.marktechpost.com/2021/11/28/google-research-open-sources-savi-an-object-centric-architecture-that-extends-the-slot-attention-mechanism-to-videos/

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

【科研必备】SCI论文下载方法收集

“工欲善其事,必先利其器”

作为一个科研狗,必然要阅读海量的文献。SCI论文作为论文海中的明珠,又该如何去获取呢?本文为大家汇总了多种SCI论文下载方式。

1. 土豪专享

“世上没有什么是钱解决不了的,如果有,那就再加几个亿”。

SCI论文支持单篇购买,但是价格也是喜人,一篇动辄几十美元,我等穷屌丝只能望而却步。再说动辄几百上千的阅读量,地主家也没有余粮啊!

从Nature杂志随机找的一篇收费论文,可以看到价格不菲

2. 官方机构

为了提供更好的科研环境,国内的科研机构或多或少都会订购一定的数据库。通过你所在机构的官方入口进入数据库,就可以光明正大薅组织羊毛了。

北大图书馆入口,通过馆藏目录可以发现里面的资源还是很丰富的

但组织的羊毛也不是那么好薅的,机构为了省钱,往往只会购买部分数据库,粗略一看全都有,细细一查全没有。而且你必须使用机构的IP才能免费使用,下班或放假就无能为力了。

好吧,聊胜于无!但残酷的是,薅组织羊毛的前提是你得有羊毛可薅啊!

遇到事情不要慌,我们先来发个朋友圈。。。哦,不!是接着往下看,干货来了。

3. 为知识自由传播而战的Sci-Hub

大学生不能不知中国知网,搞学术不能不提Sci-Hub

Sci-Hub由哈萨克斯坦软件开发暨神经技术研究生Alexandra Elbakyan 创建,于2011年9月5日正式上线。它的出现,为广大的科研学子带来了福音,让他们不再因高昂的版权费用而阻滞了对知识的渴求。

Alexandra Elbakyan,致敬先驱。

Sci-Hub是当前已知第一个提供大量自动且免费的付费学术论文的网站,用户不需要事前订阅或付款,就能够使用原本存放在付费数据库的论文文章,并提供搜索原先出版社网站内的文档文件服务。Sci-Hub 服务器基本包含了所有能够满足你所需要的SCI 论文。

Sci-hub网站截图,它的口号是扫清科学道路上的一切阻碍。

但因为侵犯了出版商的利益,Alexandra Elbakyan 被爱思唯尔起诉而全球逃亡,Sci-Hub网站也因此经常被官方屏蔽。但自由的种子一旦播下,就如同春笋,蛰伏蓄力,四处出击,竹根(主根)不绝,遇雨即出。Sci-Hub网站通过频繁更换域名来躲避查封。

《科学》称该网站为“可敬的利他主义抑或大型犯罪组织,取决于你是哪方”。

那么问题来了,如何获取最新的Sci-Hub 可用域名呢?

方法一:YoviSun工具集:https://tool.yovisun.com/scihub/

YoviSun 可以实时检测并更新Sci-Hub 最新的可用链接

方法二:维基百科搜索 Sci-Hub

截图之后,笔者发现wiki上的Sci-Hub的英文条款已作删除,中文尚可用

方法三:百度搜索

百度搜索Sci-Hub,世上总不缺乏一些热情的好心人会为你搜集信息

4. 谷歌学术

国际学术界、出版界、图书情报界为了推动科研成果自由传播而支持文献在互联网公共领域里可以被免费获取,即为开放获取(Open Access, OA)。

对于开放获取文献,可以在期刊官网免费下载,但这样未免太过繁琐。谷歌学术可以对这些开放获取的文章进行检索,而且打开后可以直接下载,是不是超方便呢。

谷歌学术检索COVID-19结果截图,[HTML]是支持在线浏览,[PDF]是支持PDF文档下载

5. LibGen

https://gen.lib.rus.ec/

它的全称是Library Genesis,据说是世界上最大的盗版资料库,拥有超过300万种电子书,5200万种科研论文,以及其他一些杂志刊物。

不仅支持SCI论文,更可以免费下载很多英文电子书,尤其是一些昂贵的专业书籍

下面是一些专门的学术搜索网站,不过这个搜索网站大多都借用了Sci-Hub的数据库。

6. SCI-Hub 文献检索

https://sci-hub.org.cn/

搜索结果示例,还提供VIP服务

7. 爱科研

https://i-research.edu.eu.org/

8. 谷粉学术

https://gfsoso.99lb.net/sci-hub.html

9. Researchgate

当你实在是找不到所需论文时,你可以直接写信向文章作者索要。但因为工作变动及一些其他原因,论文中的通讯方式可能会不太可靠,在此推荐被戏称为“科学研究的facebook”的社交网络服务网站researchgate。在这里汇集了全球的大部分科研工作者,有些作者会在此公开他们的作品,那么就可以直接下载;如若没有,可以向他们索要。不过成与不成,得看机缘。毕竟大佬也是很忙的。

10.谷歌学术镜像网站

https://ac.scmor.com/

无需多言,默默收藏。

仅部分网站可用,需耐心试验。

即便如此,有时还是会出现一些bug

或许,你需要的仅仅是一张梯子

但度过了最初的新奇,你会发现

阅尽千帆终执手,此心安处是吾乡。

保持初心,牢记使命。任他刀光剑影,风吹雨打,我自岿然不动。

最后,推荐一个一个纯粹的搜索知识、技术和经验分享平台:虫部落

你会发现一个不一样的世界,赶快去探索吧。

为什么研究方法在学术论文中很重要?

来源:科学网博客,作者傅平

研究方法的描述在英文文献里是非常关键的一章。但很多中文文献基本没有这一章,有的就用一句话带过,比如使用“文献梳理”四个字。如果我是读者,我根本不知道这位作者是怎么梳理的?是传统的手工梳理一篇一篇人工阅读?还是用某些方法比如使用软件工具甚至使用人工智能算法等?具体怎么梳理文献得到该文所需要的数据并进行编码、整理、分析的?梳理流程怎样?读者和审稿人并不清楚。如果样本数据采集的程序不规范,样本不准确,那么因此而进行所谓的分析得出的结论就值得怀疑,因此谨慎的审稿人会提出质疑。

什么是研究论文的方法部分?

研究文章的方法部分包括对用于进行实验的程序的解释。对于科学研究论文的作者,目标是清晰简洁地展示他们的发现,并提供足够的信息,以便可以重复实验。研究文章包含非常具体的部分,比如引言,文献综述,方法,结果,讨论,结论等,每篇研究文章都应在引言(含文献综述)之后包含详细的方法部分。

为什么方法部分很重要?

方法部分(也称为“材料和方法”)很重要,因为它为读者提供了足够的信息来判断研究是否有效和可重复。

研究论文中方法部分的结构

在设计一项研究时,作者通常会决定他们试图证明的关键点或研究对象之间的“因果关系”。很简单,该研究旨在实现目标。方法部分包括以下三个子部分:参与者、设备和程序。比如生物学中的方法部分可以这么组织:在生物科学中,方法部分应该尽可能地详细,目标是清晰简洁地呈现研究,使其易于理解并可以复制。如果在研究中使用动物(包括人类受试者),作者应确保包括根据概述的方案对它们进行治疗的声明,以确保治疗尽可能人道。赫尔辛基宣言是世界医学协会制定的一套伦理原则,旨在为涉及人类受试者的医学研究的科学家和医生提供指导。在机构中使用人类参与者进行的研究由其附属机构审查委员会监督,其目的是保护人类受试者在参与研究期间的权利和福利。

文献检索

进行文献检索是为了从以前的研究中收集尽可能多的相关信息。它们对于提供有关该主题的证据并帮助验证研究很重要。大多数是使用关键字或短语来搜索相关数据库来完成的。例如,MEDLINE 和 PubMed 都提供有关生物医学文献的信息。根据美国心理学会的说法,谷歌学术(Google Scholar )是“开始进行文献搜索的个人可用的最佳资源之一。” 各个学科还有一些专门的数据库,作为定位该科学和相关文献文章的首要数据库,而不是单一地查找Web of Science或知网。

现在由于研究数据管理服务的发展,很多数据库厂商开发了文本挖掘工具(text mining tool),如ProQuest的文本挖掘实验室(TDM Studio),通过 ProQuest TDM Studio 使用 R 或 Python对ProQuest 内容产品,包括政府、档案、论文和新闻数据库进行分析。再如Gale的Digital Scholar Lab数字学者实验室,使用数字人文工具探索来自 Gale Primary Sources 的馆藏。通过对历史文本(包括报纸、书籍、档案馆藏等)的分析和可视化,重新发现和解释过去。美国的共享数字文献库HathiTrust 研究中心分析(HathiTrust Research Center Analytics)能够对 HathiTrust 数字图书馆 (HTDL) 中的学术作品进行计算分析,以促进馆藏的非营利研究和教育用途。HTRC 为基于文本、数据驱动的研究创建和维护一套工具和服务,例如 HTRC 算法和数据胶囊,并从事大规模数据分析的前沿研究。HTRC 在非消费性研究范式下运作:HTRC 将馆藏用于计算分析,同时清楚地保持在法院认可的适用于文本分析的合理使用权的范围内。该中心致力于在非消费文本挖掘领域开辟新天地,使学者能够充分利用 HathiTrust 数字图书馆的内容。还有JSTOR的文本挖掘支持工具Data for Research,这是一项免费服务,适用于希望通过各种可视化工具分析 JSTOR 内容的研究人员。

研究论文的方法部分(method)应该包括什么?

研究论文中一个经常被误用的术语是“方法论”(methodology)。方法论是指科学哲学的一个分支,它涉及科学方法,而不是方法本身,因此作者应避免使用它。以下是应包含在研究论文方法部分中的主要小节列表;作者可能会更清楚地使用副标题来描述他们的研究。

文献检索:作者应该引用任何有助于他们选择方法的来源,以及使用的研究数据工具比如文本本挖掘工具。作者应指明过去研究的时间范围及其特定参数。

文献梳理:如果某论文仅仅使用文献梳理的方法,则需要说明梳理流程怎样?使用何种方法比如使用软件工具甚至使用人工智能算法等采集文中数据?具体怎么梳理文献得到该文所需要的数据并进行编码、整理、分析的?数据可否共享和其他学者再利用?

研究参与者:作者应该引用他们收到任何非人类受试者的来源。应列出使用的动物数量、年龄、性别、它们的初始条件以及它们的饲养和照料方式。如果是人类主题,作者应提供特征,例如地理位置;他们的年龄范围、性别和病史(如果相关);和科目的数量。如果使用医院记录,作者应在研究开始时包括受试者的基本健康信息和生命统计数据。作者还应说明每位受试者都提供了书面知情同意书。

纳入、排除标准:作者应描述他们的纳入和排除标准,它们是如何确定的,以及有多少受试者被淘汰。

组特征(可与结合研究参与者一起叙说):作者应描述所选组如何划分为子组及其特征,包括对照组。作者还应描述使用的任何特定设备,例如住房需求和饲料(通常用于动物研究)。如果对患者记录进行审查和评估,作者应提及审查人员是否对其不知情。

过程或程序:作者应描述他们的研究设计。必须解释任何必要的准备工作(例如,组织样本、药物)和仪器。作者应该描述受试者如何“被操纵来回答实验问题”。应包括时间表以确保程序清晰(例如,“大鼠被给予 XX 药物 14 天”)。对于处死的动物,应概述使用的方法和遵循的协议。

统计分析:应该描述数据的类型、它们是如何测量的以及进行了哪些统计测试。注意:这不是“结果”部分;任何相关的表格和数字都应该在后面引用。必须引用使用的特定软件。

在撰写研究方法时注意避免无助研究的背景信息。避免提供很多关于人类受试者的细节。作者应该更多地关注他们的方法如何用于满足他们的目标而不是机制。方法的局限性以及它们如何被克服的(通常在您的“研究局限”一章中讨论)。这将有助于验证结果。

一个深思熟虑的方法部分是期刊稿件中最重要的部分之一,其中研究数据是关键,现在美国大于50万美元的研究项目在申请基金时都必须提交研究数据管理计划(data management plan),研究成果出来后,有些出版商也要求提供研究数据以供共享和再使用。