毕业论文文献综述、文献查询和外国文献翻译技巧都是干货

随着全球化的发展，我们和世界的交往也越来越多，尤其是情报分析师，更要广泛接触全球各类资讯，了解各种先进的情报工作方法，学习各种情报工具的使用方法和技巧。

之前也给大家推送了如何通过搜索引擎收集各类资讯的技巧，但是我们收集的很多论文和文章都是外文版的，我之前也和大家一样，看这类文章要逐字逐句通过复制粘贴到在线翻译网站翻译后阅读，效率非常低下，严重影响阅读效果和阅读的兴趣。

后来随着各种翻译网站、翻译软件、翻译插件的不断升级，尤其是近两年随着人工智能的迅猛发展，机器翻译的质量也得到大幅提升。因此，平时运用机器翻译的插件和浏览器阅读外文网站都能享受较为精准的实时翻译。

因为之前也分享过一些外文的PDF文档给大家，有战友咨询外文PDF文档的翻译方法，今天就给大家推荐一种利用office软件翻译PDF文档的方法：

1、使用office的word打开需要翻译的PDF文档。

具体方法：鼠标放到文档上，点击右键，在打开方式里选择word。

2、打开底部“审阅”功能菜单，选择“翻译”插件。

3、选择底部的语言选择菜单。

4、根据PDF文档的语言类别设置翻译语言，支持非常多的语言翻译。

5、选择在翻译菜单功能栏目里选择“翻译文档”（使用联机服务翻译文档）。即可在浏览器中看到翻译过后的文档内容。

外文资料翻译，旨在通过文献查阅与翻译，进一步提高学生使用外语的能力，以熟悉本专业主要的外文书籍，了解毕业设计（论文）课题的国内外发展动向。

对于很多小伙伴而言，这一项“外文翻译”工作可真是个磨人的小妖精。众所周知，许多领域的高水平论文和著作都是外文文献。因而在科研过程中，阅读和翻译外文文献又是一个必不可少的重要环节。

哪里找？

在进行外文资料翻译之前，我们要找出与课题相关的外文文献。

1.咨询导师或者师兄师姐。开始做外文翻译工作的同学，想必已经确立了选题和指导老师。在已经确定了指导老师的前提下，老师和教研室的师兄师姐就是最好的资源。请他们给你推荐一些著作和论文，你就能省去在浩如烟海的文献里筛选目标文献的时间。毕竟，指导老师走过的科研之路比你吃过的盐都多呀。

2.Google搜索。如果没办法取得第1条中的便利，那我们就“自己动手，丰衣足食”吧。我们可以登录Google scholar（谷歌学术）网站，输入课题关键词可以得到大量相关的文献。不过这个时候，需要我们自己甄别文献质量的高低。该文献的引用量是个很重要的参考指标，一般而言，引用量越高的文章质量也相应地高。

3.通过高校图书馆系统。很多同学只知道图书馆有丰富的馆藏资源，却忽视了海量的电子资源。各大高校为了学术的研究，不惜斥巨资购买许多海内外出版发行集团的下载权限，为师生提供了极大的便利。通过学校图书馆系统进入中外文数据库，可以免费且不限次地下载想要的文献。几大主流的数据库有：中国知网（CNKI）、维普、万方、Engineering Index（EI）、Elsevier。

怎么翻？

找到理想的外文文献后，接下来便是痛并快乐着的翻译工作。这个时候，英语并不是十分突出的小伙伴必须找需要一些工具来协助翻译了。

1.有道词典。小编在看外文文献的时候，最常用的是有道词典。翻译之前，打开有道词典的自动取词功能，停在不认识的单词上面，有道会自动识别并给出相应的中文意思。

2.Google翻译。知道了陌生单词的意思，并不意味着可以完全给出句子或者段落的意思。通过Google翻译，可以解决一些长句的翻译问题。但要注意的是，不可完全依赖机器翻译，而要在机器翻译的基础上加上个人对句子的理解。

3.知网翻译助手。某些情况下，即使借助了前两项工具，也不能理解翻译的意思。这很可能是因为句子中出现了专业词汇，而有道和谷歌翻译并没有提示。通过知网翻译助手搜索词条，出现的结果是专业词汇，并且在翻译结果下面有文献与之对应，因而可靠度大大提高。

由软件生成的假论文充满了废话，但它们欺骗了真正的学者

只需输入作者名，电脑就能帮你生成一篇“SCI级别”的计算机论文。

摘要、背景介绍、实验结果、图表、讨论以及结论等都一应俱全。

世上就是有这等美事。

只要你想，一口气就能搞个几百篇计算机论文。

尽管SCIgen只是一个网页程序，但它产出的论文格式可能比一些本科论文还要规范。

这是本人用SCIgen自动生成的论文，SCIgen官方网站为https://pdos.csail.MIT.edu/archive/scigen/感兴趣的可以自己一试

不过也别高兴得太早，到目前为止AI还无法取代人类完成科研任务。

别看这些生成的论文有模有样，但根本没有地球人能看得懂。

不是因为太高深，内容纯属是“一本正经地胡说八道”。

但这并不要紧，因为在学术界总是会有人上当。

将这些计算机论文，投稿到一些国际学术期刊还会被录用，极具讽刺意味。

SCIgen界面

学术出版界也是个江湖，同样鱼龙混杂。

并不是所有人，都奔着证明自己或是发现真正有价值的东西而来。

而SCIgen这个程序的诞生，就是为了戏耍学术界的那些“野鸡期刊”。

这些只以盈利为目的的野鸡期刊也叫掠夺性期刊（Predatory journals

），学术质量与信誉都很低。

他们的日常就是疯狂地给科研人员发送垃圾邮件，以“征集论文”之名吸引那些没有发表经验的学者上当。

一般来说在论文发表前，学术刊物主编会邀请专业领域内有一定造诣的同行学者，评议论文的质量。

这也叫同行评议，刊物会按评议结果决定是否发表。

但掠夺性期刊，只要钱到位他们都能安排论文的发表，连审都不用审。

因为日常不堪骚扰，麻省理工学院（MIT）计算机科学与人工智能实验的几个学生就看不过去了。

2005年，Dan Aguayo、Max Krohn和Jeremy Stribling三人，决定向这种”水”得不行的期刊和会议宣战。

从左到右分别为Dan Aguayo、Max Krohn和Jeremy Stribling

那时已临近学期末，但这MIT三剑客还是花了一两星期去开发这个小程序。

SCIgen的原理很简单，有些类似于填词游戏。

学术论文的格式是非常相似的，它本身就充满了专业词汇和固定的句式。

而SCIgen则能够从固定的词库中，随机抽取出这类计算机领域内的专业术语，以符合语法的方式生成文本。

再加上一些漂亮的图表和详细的参考文献等，就能骗过不少外行。

SCIgen生成的论文中带有的图表

但这个软件真没多厉害，内行人一看就知道全文是在“胡说八道”。

要怪，就怪一些期刊和会议灌水得太过分了。

不出所料，他们第一篇自动生成的论文就攻破了WMSCI（World Multiconference on Systemics, Cybernetics and Informatics）会议的防线。

这篇论文名为《Rooter：处理接入点与冗余的典型合一方法》，看似高大上其实内容根本不知所云。

而WMSCI会议，不但接受了这篇假论文，还邀请作者出席会议作报告。

这下可高兴坏了MIT三剑客。

毕竟在这之前，他们就听说WMSCI会议以接受水货著称，但没真想到他们居然这么水。

于是，他们便把SCIgen攻陷WMSCI的事情经过发到网上。

一波嘲讽下来，这在科研圈立马引起了广泛的关注。

毕竟大家早就看不惯这些掠夺性期刊和会议。

这下WMSCI会议是颜面扫地，立马撤回了对他们团队的邀请。

不过，失去报告资格，这三剑客反倒来了兴致。

利用在网络上众筹来的2500美金，他们决定将恶作剧升级，搞一波大的。

这三人，长途跋涉地在同一天赶往了会议所在的佛罗里达州奥兰多市。

就在大会举办的同一地点，他们租了一块场地，用“假身份”开了一场属于自己的“分会场”。

“假会议”现场，该有的都有

想要伪装一场学术会议并不难，和论文灌水一样只要有钱就够了。

而报告内容用SCIgen就能无限生成，这种垃圾想要多少就有多少。

除此之外，他们还置办了一批假的宣传海报、假名片、假胡子和假发等。

反正，这场学术会议的一切都是假的。

但这并不妨碍有人上当，当时来听他们装模作样演讲的人还不少。

如果不明真相，或许这些人到现在都仍以为自己是在听WMSCI的报告。

演讲现场，图中为戴着假发的Jeremy Stribling

但这场闹剧，并没有随着这场假学术会议的结束而收场。

刚开始，只是IEEE撤销了对WMSCI会议的资助。

到后来，越来越多人开始使用SCIgen产出的“钓鱼文”在其他学术期刊“试水”。

现阶段，这三位SCIgen元老已步入职场，深藏功与名。

而他们留下的这款软件，则将学术界搅得天翻地覆。

例如，德国的学生利用这款神器，就攻下了2008年和2009年在中国武汉举办的两个IEEE国际会议。

当时，Schlangemann教授就被当成知名学者，还被邀请作为会议的主持人出席。

但Schlangemann教授并非真有其人，他只是一个由这位学生创造的虚拟角色。

而这个名字，则源于一部名为Der Schlangemann的德国电影。

Schlangemann教授还有虚拟的个人网站，感兴趣可以自行搜索Der Schlangemann的形象，比想象中还要讽刺

现在SCIgen的访问量依然惊人。每年的浏览量仍超过60万次，无数钓鱼文在源源不断地产出。

这导致了这个页面，隔几个月就要崩溃一回。

2013年，法国格勒诺布尔大学的研究员Cyril Labbé就透露了一个令人不安的事实。

他在IEEE和Springer出版公司旗下的期刊中，就发现了超过120篇SCIgen生成的诈文。

对于自己是否已彻底排查出所有乱入的伪论文，Labbé自己心里也没底。

因为他本人也无法从有限的订阅源内下载所有的论文。

这也是学术出版商常常遭到诟病的一点。

想在期刊上发论文需要收取高昂的版面费，但想在上面下载论文则又要付另外一笔费用。

就算是作者本人在学术期刊上发表的论文，想要下载都不能例外，一律收费。

而除了期刊的审核不严格，Labbé还揭示了另一个漏洞。

那就是，利用SCIgen这类垃圾论文软件，竟可以给自己狂刷h指数（H index)。

一名科研人员的h指数，是指他至少有h篇论文被引用了至少h次。

这是评价个人学术成就的一个新方法。

例如，某人的h指数是20，这表示他已发表的论文中，每篇被引用了至少20次的论文总共有20篇。

但所谓的H指数，在SCIgen的捣乱下就无法起效了。

当时，Labbé就以“IKE ANTKARE”作为作者名（注意，IKE ANTKARE这人并不存在），用SCIgen生成了102篇垃圾论文。

这让IKE ANTKARE在谷歌学术中的h指数，一下子飙升到了94。

他还一度挤进了计算机科学领域科学家中h指数排名的前六。

当然，为了让h指数变高，他也用了一点小技巧。

这100篇假论文中，每篇都会对所有作者名为IKE ANTKARE的假论文进行引用。

而为了让谷歌学术能够对这100篇论文进行索引，Labbé还在参考文献中加入了唯一一篇真实的，已被谷歌学术索引的论文。

“我自己引用自己”，就这样IKE ANTKARE凭一己之力就成了学术界冉冉升起的新星。

这一虚拟人物的h指数，甚至比爱因斯坦还要高。

当然，IKE ANTKARE这颗学术新星陨落得也很快。

因为Labbé已经将自己的一系列骚操作写成论文，对世人公开了IKE ANTKARE的虚拟身份。

随后谷歌学术，就对IKE ANTKARE进行了封杀并删除了他的论文。

Cyril Labbé本人

因为一些知名学术期刊，会对这些计算机生成的诈文照单全收。

那么，我们就有理由相信一些作者会把SCIgen当作赚钱的工具。

于是，为了揪出这些混入科学期刊的诈文，Labbé就与Springer合作特意开发了一款针对SCIgen的软件——SciDetect。

这款开源软件，能够自动检测出哪些是由SCIgen生成的假论文。

但在这之后，SCIgen的创始人之一Stribling是这样评价此事的。

“他们开发了一个新程序，而不是制定更好的政策让所有被接受的论文有更好的评审过程，这事本身就挺搞笑的”。

事实上，SciDetect的作用并不大，想要绕开这个程序的检测并不难。

Stribling表示，如果这是一场军备竞赛，他敢打赌再次骗过SciDetect只是时间的问题。

事实上，学术钓鱼从上个世纪就已经存在了。

早在1996年，量子物理学家艾伦·索卡尔(Alan Sokal)撰写的一篇科学诈文，就引起了一场“科学大战”。

他将一篇充满了常识性错误的论文，投稿至著名的文化研究杂志《社会文本》。

标题为《超越界限：走向量子引力的超形式的解释学》。

结果《社会文本》的五位主编，都没有发现这是一篇诈文，还一致通过将文章发表。

东窗事发，这立即触发了一场席卷全球的科学大论战，世界众多著名的媒体都参与其中。

艾伦·索卡尔

相比SCIgen，艾伦·索卡尔还是比较有诚意的。

尽管内容还是一本正经地胡说八道，但论文毕竟还是他自己亲手炮制的。

他将量子物理学中的术语、后现代主义领军人物的术语，还有他自己捏造词句糅合在了一起。

于是便得到了一篇毫无学术内涵，但又充满“后现代”风格的诈文。

而作为学术钓鱼的鼻祖，之后的学术钓鱼事件都被称为“索卡尔的平方”。

那么学术钓鱼，何时能消失？很简单，只有鱼儿不上钩，钓鱼就会自动失去意义。

*参考资料

Adam Conner-Simons.How three MIT students fooled the world of scientific journals.MIT News.2015

Jerrusalem.“三傻”大闹科研坞：我们怎么钓出了那些水货？.果壳网专访.2015

李慧翔.给我一篇假论文，我能骗倒半个地球.南方周末.2013

John Bohannon.Hoax-detecting software spots fake papers.Science.2015

CYRIL LABBÉ.One of the great stars in the scientific firmament. ISSI NEWSLETTER.201

谷歌2019年学术索引列表CVPR首次进入前10名，何开明的论文被引用率最高

【新智元导读】今天，谷歌发布了2019最新版学术指标，对收录的会议和期刊的影响力进行排名。AI类的多个顶会进入榜单Top 100，CVPR更是进入前10，而何恺明的“深度残差网络”单篇引用次数高达25256次，引用量最高！

今天，谷歌正式发布了2019年版的学术指标(Scholar Metrics)。

本次发布涵盖2014-2018年发表的文章，并包括了截至2019年7月在谷歌学术中被索引的所有文章的引用。

最新版的谷歌学术指标有以下亮点：

两大自然科学顶刊Nature和Science分别排名第一和第三；
计算机视觉顶会CVPR首次进入综合榜单Top 10；
一共有六个人工智能类顶会进入综合榜单Top 100；
多篇人工智能论文出现在Nature的高引论文中；
何恺明的“深度残差学习”论文是最近5年CV类引用次数最多的论文，被引25256次

谷歌学术指标为作者提供了一种简便的方法，让学者们可以快速评估学术出版物最近文章的影响力。

学术指标的收录包括遵循谷歌学术收录指南的网络期刊，并选择了工程和计算机科学的主要会议。2014-2018年间论文少于100篇的出版物，或2014-2018年间未被引用的出版物没有被收录在内。

在谷歌的官方网站上，你可以用特定的类型关键词进行搜索，比如 Ceramic Engineering、 High Energy & Nuclear Physics 或者 Film ；或者更宽泛的领域，比如 Engineering & Computer Science 或者 Humanities, Literature & Arts 。

在网站上，你可以看到根据 5 年高引用（h5指数）和 h5中位数指标排名的前 20 出版物。你也可以看到不同语种排名前 100 的出版物，比如中文、西班牙语和葡萄牙语。每一个出版物，你可以点击 h5-index 查看该出版物被引用最多的论文。

学术指标包括超出按类别和按语言列出的大量出版物。你可以通过在搜索框中输入关键词来找到这些内容，例如[security]、[soil]、[medicina]。

综合榜单Top 20：CVPR首次进入前10名，NeurIPS第27

谷歌学术把英文类出版物分为以下几大类：

商业、经济和管理
化学和材料科学
工程和计算机科学
健康和医学科学
人文、文学和艺术
生命科学和地球科学
物理和数学
社会科学

首先来看看综合排名。

英文类出版物，网站列出了 TOP100 的名单，其中 Nature 排名第一，H5 指数 368，H5 中位数 546。

另一科学顶刊Science排名第三，H5指数338，H5中位数511。

特别值得注意的是，计算机视觉的顶会CVPR排名进入了Top 10。去年CVPR的排名是第20，一跃进步了10名。

此外，AI 领域另一个备受关注的会议 NeurIPS，也在综合排名中位列第 27（去年是第54）。

其他人工智能类会议，ICLR排名第42，ECCV排名第56，ICML排名第59，ICCV排名第71。

此外，IEEE系期刊中《IEEE模式分析与机器智能学报》排名第76，《IEEE工业电子学报》排名第81，《IEEE电力电子学报》排名第98。

再来看单篇论文的被引次数：

其中，Nature杂志今年来被引用次数最高的Top 5论文中，人工智能相关论文占了3篇，分别是LeCun、Bengio和Hinton2015年发表的“Deep Learning”综述论文，DeepMind的“Q-network”深度强化学习论文，以及同样来自DeepMind的“通过深度神经网络和树搜索掌握围棋游戏”论文。

工程与计算机领域Top 20

工程和计算机科学类目下分为 56 个子项目，其中包括人工智能、计算机语言学、计算机视觉与模式识别、人机交互、Robotics等。下文将对这些领域进行详细介绍。

人工智能 TOP 20

一眼看去，人工智能分类(不包含CV、NLP等子领域)的TOP 20有多个是顶会，包括前面提到进入综合榜单TOP 100的NeurIPS、ICLR和ICML。

此外，AAAI虽然没有进入总榜Top 100，但在人工智能类排名第7。

让我们来发表在人工智能类会议中被引用次数最高的论文：

1. Adam: A Method for Stochastic Optimization.

DP Kingma, J Ba

ICLR

引用次数：25240

2. Very Deep Convolutional Networks for Large-Scale Image Recognition.

K Simonyan, A Zisserman

ICLR

引用次数：24554

3. Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift.

S Ioffe, C Szegedy

ICML, 448-456

引用次数：11293

4. Faster R-CNN: towards real-time object detection with region proposal networks

S Ren, K He, R Girshick, J Sun Proceedings of the 28th International Conference on Neural Information …

引用次数：10517

5. Generative adversarial nets

IJ Goodfellow, J Pouget-Abadie, M Mirza, B Xu, D Warde-Farley, S Ozair, …

Proceedings of the 27th International Conference on Neural Information …

引用次数：10175

可以看到，Adam随机优化方法以25240次引用排名第一，何恺明大神的Faster R-CNN以10517次引用进入前5，比Goodfellow的生成对抗网络论文略高。

计算机视觉与模式识别类 TOP 20

在计算机视觉与模式识别领域，三大视觉顶会CVPR、ECCV和ICCV分列前三。

第4和第5则分别是IEEE系的两本会刊：《IEEE模式分析与机器智能学报》和《IEEE图像处理学报》，两者h5指数均超过100.

接下来是计算机视觉与模式识别类引用最高的论文：

1. Deep Residual Learning for Image Recognition

K He, X Zhang, S Ren, J Sun

Proceedings of the IEEE Conference on Computer Vision and Pattern …

引用次数：25256

2. Going Deeper With Convolutions

C Szegedy, W Liu, Y Jia, P Sermanet, S Reed, D Anguelov, D Erhan, …

Proceedings of the IEEE Conference on Computer Vision and Pattern …

引用次数：14424

3. Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

S Ren, K He, R Girshick, J Sun

IEEE Transactions on Pattern Analysis and Machine Intelligence 39 (6), 1137-1149

引用次数：10517

4. Fully Convolutional Networks for Semantic Segmentation

J Long, E Shelhamer, T Darrell

Proceedings of the IEEE Conference on Computer Vision and Pattern …

引用次数：10153

5. Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation

R Girshick, J Donahue, T Darrell, J Malik

Proceedings of the IEEE Conference on Computer Vision and Pattern …

引用次数：8960

这个类别中，何恺明的“深度残差网络”以25256次引用排名第一！（由于被IEEE计算机视觉与模式识别论文集收录，Faster R-CNN出现了两次。）

计算机语言学 TOP20

在自然语言处理（Google scholar 中的分类是 Computational Linguistics）领域，不出意外，排名前三的是三大NLP顶会：ACL、EMNLP和NAACL。

接下来是计算语言学类引用最高的论文：

1. Glove: Global Vectors for Word Representation

J Pennington, R Socher, C Manning

Proceedings of the 2014 Conference on Empirical Methods in Natural Language …

引用次数：8358

2. The Stanford CoreNLP Natural Language Processing Toolkit.

CD Manning, M Surdeanu, J Bauer, JR Finkel, S Bethard, D McClosky

ACL (System Demonstrations), 55-60

引用次数：5618

3. Convolutional Neural Networks for Sentence Classification

Y Kim

Proceedings of the 2014 Conference on Empirical Methods in Natural Language …

引用次数：4551

4. Learning Phrase Representations using RNN Encoder–Decoder for Statistical Machine Translation

K Cho, B van Merrienboer, C Gulcehre, D Bahdanau, F Bougares, …

Proceedings of the 2014 Conference on Empirical Methods in Natural Language …

引用次数：3629

5. A Convolutional Neural Network for Modelling Sentences

N Kalchbrenner, E Grefenstette, P Blunsom

Proceedings of the 52nd Annual Meeting of the Association for Computational …

引用次数：1838

人机交互和机器人学TOP 20

最后，我们分别看一下人机交互和机器人学领域的Top 20顶刊/顶会：

h5 指数是指在过去整整 5 年中所发表文章的 h 指数。h 指在 2014-2018 年间发表的 h 篇文章每篇至少都被引用过 h 次的最大值。

出版物的 h5 中位数，是指出版物的 h5 指数所涵盖的所有文章获得的引用次数的中位值。

想了解更多高影响力期刊和论文，请点击阅读原文到官网查看。