日本研究生院:代码直播!经济论文的数据和最新研究见此

经济学论文写作中最重要的部分是什么?

青山学院大学的安井健悟老师曾指出,论文写作中最重要的是:“进入分析之前要确立完备的研究计划。所谓确立研究计划,是指确定研究主题和假说(和计量模型),调查先行研究,推测确立数据搜集的大致情况。”

所以在进行论文写作之前,收集到足以支撑自己研究的数据和先行文献是非常有必要的!本文整理的这些经济学论文网站、数据网站以及参考书目都是日本大学的教授亲自推荐的,希望能帮助大家找到自己需要的资料,完成自己的研究论文!(。•ᴗ-)_

想收集先行文献看这里!

查找先行研究,首先是要有方便的论文数据库,由知名数据公司Clarivate运营的“Web of Science”和美国经济学会运营的“EconLit”等都是非常好的论文数据网站。此外,“Google Scholar”谷歌学术搜索也是我们熟悉的老朋友了,当然是必不可少的。

此外,如果搜索日语论文的话要用到“CiNii”(日本国立情报学研究所,类似国内的知网)。而如果各位要找上文提到的安井老师专攻的劳动领域的话,可以在劳动政策研究机构的网站中的“論文データベース”(论文数据库)中找到哦~

阅读经济学老师和教授们写的研究论文对自己的论文写作也是很有帮助的,如果要找教授们的论文可以前往以下网站:

想收集论文数据看这里!

接下来,想为大家介绍收集论文数据时十分有用的网站。以下将“总计数据”与“个体数据”分开,给大家直接上链接!

一、【总体数据】

如果要找的是总体数据,在各种网站上公开的数据大多数都不需要进行申请就可以使用(但一定要注意标明数据出处哦!)。以下是一小部分网站,希望其中有适合的数据能满足大家的需求~

都道府县的数据:“社会生活统计指标-都道府县的指标”(总务省统计局)

● 其它的日本国内的政府统计:“e-Stat 政府统计的综合窗口”

● 各国的数据:“OECD.Stat”、“The World Bank DataBank”

二、【个体数据】

使用个体数据需要申请并且有很多注意点(为了数据不被对应到个人,使用数据时要多加小心)。东京大学社会科学研究所的社会研究和数据档案中心以及庆应义塾大学的小组数据设计和分析中心是两个个体数据来源,本科生也可以在完成一定手续后使用。

从东大的网站中,可以查询 "东京大学年轻人社会调查"、"东京大学中年人群社会调查 "和 "全国就业状况小组调查 "等数据;

从庆应的网站中,可以查询 "日本家庭小组调查"、"日本儿童小组调查"、"消费者事务小组调查"、"新开业企业小组调查 "等等数据。以上数据我们都可以通过申请借用,来运用进自己的论文里。

经济学参考书目推荐!

最后为大家介绍一些在学习经济学时能用到的参考文献和教科书。

首先是明治大学的加藤久和老师在《近年的实证分析的动向与学部教育》中介绍的以下三本书:

水落老师推荐了以下这本数据整理和统计分析方法的入门书:

庆应义塾大学的广濑康生老师推荐了以下四本面向本科生的学习动态随机一般均衡模型(DSGE模型)的日语解说书。

值得一提的是,在广濑老师的研讨会首页上还可以阅览到学生们运用了DSGE模型完成的研究论文噢~

最后,关西学院大学的栗田匡相老师介绍了以下几本经济学知识获取用的教科书:

文章出处:経済セミナー編集部官网

以上就是为大家推荐的,查找经济学的先行文献及数据的一些内容啦~

如果你觉得对你有帮助的话,就点个赞鼓励一下东学君吧,我们将继续为你分享更多干货信息!ヾ(·ω·*)ノ

研究越不可靠,引用率越高?

撰文 | 小雨

长期以来,一篇学术论文的被引用次数,都被视为是衡量一项研究的质量的重要指标,但这也存在争议。比如2011年,一篇发表在《科学》杂志上的心理学论文就发布了一个非常“有趣”的结论,论文称,人们将互联网作为一种“外部”记忆形式,依赖它来获取信息,而不是靠自己回忆事实。这样的研究结果在社交媒体和学术界都引发了不小的轰动。

然而,在2018年的一项研究中,一组研究人员对21篇于2010年和2015年之间发表在《科学》和《自然》期刊上的备受瞩目的论文进行了检验,其中就包括我们刚刚提到的那篇论文。研究人员发现,这篇论文中的一项关键发现无法被复制。但是,这篇论文的被引用次数高达1417次,其中有超过400次引用发生在2018年的复制工作之后。

于是,关于学术论文的引用次数出现了这样一种声音:在一项发现的有趣程度和不可复制性之间,存在某种关联,越是不可靠的研究,传播度越广。现在,一项新的研究结果似乎印证了这场正在发生的“复制危机”。

5月21日,加州大学圣迭戈分校的经济学家Marta Serra-Garcia和Uri Gneezy在《科学进展》杂志上发表了一项新的研究,他们发现当试图对那些发表在主要的心理学、经济学和科学期刊上的社会科学以及医学论文进行重复时,很多结果都不成立。而且与那些可复制的研究相比,无法复制的研究的被引用次数往往比那些可复制的研究更高。

在这项研究中,Serra-Garcia和Gneezy从三个有影响力的复制项目中,收集到了80篇论文的数据。这些项目试图系统地复制一些发表在顶级心理学、经济学和其他综合类科学期刊(如《自然》和《科学》)上的发现。从数据来看,在心理学领域被调查的100个实验中,只有39%被成功复制;经济学领域的18项研究中有61%的可被复制。

研究人员分析了这些论文在谷歌学术搜索(Google Scholar)上的数据,发现那些无法被复制的论文有着明显更高的被引用次数,平均每年被多引用16次。这是一个很显著的数字,同一时期的那些发表在具有较高影响力的期刊上的论文,平均每年只能积累约40次的引用次数。随着时间的推移,最终平均来说,无法成功复制的论文的被引用次数比能够复制的论文的引用次数多153次。

有意思的是,研究人员还发现,发表在《自然》和《科学》上的论文有着最显著的引用次数差距——不可复制论文的被引用次数比可复制论文的被引用次数多300次。

而且,当研究人员检查这些不可复制的论文在复制项目发表之后的引用次数时,发现这种差距也仍然存在。引用这些论文的研究很少在新论文中提到复制失败的事实,据调查,提到了复制失败一事的研究只有12%。

在论文中,研究人员写道,其实专家是可以很好地预测哪些论文将能被复制、哪些不能的。因此他们想知道,为什么那些不可复制的论文还是能得以发表呢?他们提出了一种可能的答案,即学术期刊的评审团队在做“取舍”,当一项研究的结果看起来“很有趣”时,他们就会降低对其证据的要求,采用更低的可重复性标准。

有趣的发现也会被媒体更多地报道,或者会在一些社交网络平台传播,引发大量关注。这也是学术研究中的一个矛盾:科学家既希望他们的工作是准确的,但也希望他们的结果能吸引关注。

当然,一次失败的复制并不意味着最初的发现就一定是错误的。因为对于一些社会科学研究来说,研究方法的改变和参与者习惯的演变,有可能导致新得出的结果不同于过去。

但不可否认的是,新的研究结果或许指出了一个我们在评判一项研究时所存在的“根本问题”,即大多数学术机构都将引用次数作为衡量一项研究的重要指标,以及一些期刊也倾向于刊登更有趣、更吸引眼球的发现,是目前复制危机的根源。

而那些被多次引用的并不可靠的研究所能产生的影响可能是巨大的。例如1998年,英国的神经科医生Andrew Wakefield在著名的生物医学期刊《柳叶刀》上发表了一篇论文,称自闭症和接种麻腮风(麻疹、腮腺炎和风疹)三联疫苗之间存在关联,导致世界各地无数的父母加入了反对麻腮风疫苗的行列。虽然《柳叶刀》在2010年撤回了这项错误的发现,然而关于自闭症与麻腮风疫苗有关的说法仍没有停息。

我们说,“非凡的主张需要非凡的证据”。这或许应该成为学者和期刊评审团队在看到有趣的研究结果时谨记在心的一条宗旨。新的研究结果再次提醒我们,无论是学者还是评审,都应该付出额外的努力来加强已发表研究成果的可信度;同时,当读者在读到有趣的研究时,也应该持更谨慎的态度。

参考来源

1. https://ucsdnews.ucsd.edu/pressrelease/a-new-replication-crisis-research-that-is-less-likely-be-true-is-cited-more

2. https://www.sciencemag.org/news/2021/05/unreliable-social-science-research-gets-more-attention-solid-studies

3. https://advances.sciencemag.org/content/7/21/eabd1705

本文经授权转载自微信公众号“原理”,原题目为《新的可重复性危机》。

为什么研究方法在学术论文中很重要?

来源:科学网博客,作者傅平

研究方法的描述在英文文献里是非常关键的一章。但很多中文文献基本没有这一章,有的就用一句话带过,比如使用“文献梳理”四个字。如果我是读者,我根本不知道这位作者是怎么梳理的?是传统的手工梳理一篇一篇人工阅读?还是用某些方法比如使用软件工具甚至使用人工智能算法等?具体怎么梳理文献得到该文所需要的数据并进行编码、整理、分析的?梳理流程怎样?读者和审稿人并不清楚。如果样本数据采集的程序不规范,样本不准确,那么因此而进行所谓的分析得出的结论就值得怀疑,因此谨慎的审稿人会提出质疑。

什么是研究论文的方法部分?

研究文章的方法部分包括对用于进行实验的程序的解释。对于科学研究论文的作者,目标是清晰简洁地展示他们的发现,并提供足够的信息,以便可以重复实验。研究文章包含非常具体的部分,比如引言,文献综述,方法,结果,讨论,结论等,每篇研究文章都应在引言(含文献综述)之后包含详细的方法部分。

为什么方法部分很重要?

方法部分(也称为“材料和方法”)很重要,因为它为读者提供了足够的信息来判断研究是否有效和可重复。

研究论文中方法部分的结构

在设计一项研究时,作者通常会决定他们试图证明的关键点或研究对象之间的“因果关系”。很简单,该研究旨在实现目标。方法部分包括以下三个子部分:参与者、设备和程序。比如生物学中的方法部分可以这么组织:在生物科学中,方法部分应该尽可能地详细,目标是清晰简洁地呈现研究,使其易于理解并可以复制。如果在研究中使用动物(包括人类受试者),作者应确保包括根据概述的方案对它们进行治疗的声明,以确保治疗尽可能人道。赫尔辛基宣言是世界医学协会制定的一套伦理原则,旨在为涉及人类受试者的医学研究的科学家和医生提供指导。在机构中使用人类参与者进行的研究由其附属机构审查委员会监督,其目的是保护人类受试者在参与研究期间的权利和福利。

文献检索

进行文献检索是为了从以前的研究中收集尽可能多的相关信息。它们对于提供有关该主题的证据并帮助验证研究很重要。大多数是使用关键字或短语来搜索相关数据库来完成的。例如,MEDLINE 和 PubMed 都提供有关生物医学文献的信息。根据美国心理学会的说法,谷歌学术(Google Scholar )是“开始进行文献搜索的个人可用的最佳资源之一。” 各个学科还有一些专门的数据库,作为定位该科学和相关文献文章的首要数据库,而不是单一地查找Web of Science或知网。

现在由于研究数据管理服务的发展,很多数据库厂商开发了文本挖掘工具(text mining tool),如ProQuest的文本挖掘实验室(TDM Studio),通过 ProQuest TDM Studio 使用 R 或 Python对ProQuest 内容产品,包括政府、档案、论文和新闻数据库进行分析。再如Gale的Digital Scholar Lab数字学者实验室,使用数字人文工具探索来自 Gale Primary Sources 的馆藏。通过对历史文本(包括报纸、书籍、档案馆藏等)的分析和可视化,重新发现和解释过去。美国的共享数字文献库HathiTrust 研究中心分析(HathiTrust Research Center Analytics)能够对 HathiTrust 数字图书馆 (HTDL) 中的学术作品进行计算分析,以促进馆藏的非营利研究和教育用途。HTRC 为基于文本、数据驱动的研究创建和维护一套工具和服务,例如 HTRC 算法和数据胶囊,并从事大规模数据分析的前沿研究。HTRC 在非消费性研究范式下运作:HTRC 将馆藏用于计算分析,同时清楚地保持在法院认可的适用于文本分析的合理使用权的范围内。该中心致力于在非消费文本挖掘领域开辟新天地,使学者能够充分利用 HathiTrust 数字图书馆的内容。还有JSTOR的文本挖掘支持工具Data for Research,这是一项免费服务,适用于希望通过各种可视化工具分析 JSTOR 内容的研究人员。

研究论文的方法部分(method)应该包括什么?

研究论文中一个经常被误用的术语是“方法论”(methodology)。方法论是指科学哲学的一个分支,它涉及科学方法,而不是方法本身,因此作者应避免使用它。以下是应包含在研究论文方法部分中的主要小节列表;作者可能会更清楚地使用副标题来描述他们的研究。

文献检索:作者应该引用任何有助于他们选择方法的来源,以及使用的研究数据工具比如文本本挖掘工具。作者应指明过去研究的时间范围及其特定参数。

文献梳理:如果某论文仅仅使用文献梳理的方法,则需要说明梳理流程怎样?使用何种方法比如使用软件工具甚至使用人工智能算法等采集文中数据?具体怎么梳理文献得到该文所需要的数据并进行编码、整理、分析的?数据可否共享和其他学者再利用?

研究参与者:作者应该引用他们收到任何非人类受试者的来源。应列出使用的动物数量、年龄、性别、它们的初始条件以及它们的饲养和照料方式。如果是人类主题,作者应提供特征,例如地理位置;他们的年龄范围、性别和病史(如果相关);和科目的数量。如果使用医院记录,作者应在研究开始时包括受试者的基本健康信息和生命统计数据。作者还应说明每位受试者都提供了书面知情同意书。

纳入、排除标准:作者应描述他们的纳入和排除标准,它们是如何确定的,以及有多少受试者被淘汰。

组特征(可与结合研究参与者一起叙说):作者应描述所选组如何划分为子组及其特征,包括对照组。作者还应描述使用的任何特定设备,例如住房需求和饲料(通常用于动物研究)。如果对患者记录进行审查和评估,作者应提及审查人员是否对其不知情。

过程或程序:作者应描述他们的研究设计。必须解释任何必要的准备工作(例如,组织样本、药物)和仪器。作者应该描述受试者如何“被操纵来回答实验问题”。应包括时间表以确保程序清晰(例如,“大鼠被给予 XX 药物 14 天”)。对于处死的动物,应概述使用的方法和遵循的协议。

统计分析:应该描述数据的类型、它们是如何测量的以及进行了哪些统计测试。注意:这不是“结果”部分;任何相关的表格和数字都应该在后面引用。必须引用使用的特定软件。

在撰写研究方法时注意避免无助研究的背景信息。避免提供很多关于人类受试者的细节。作者应该更多地关注他们的方法如何用于满足他们的目标而不是机制。方法的局限性以及它们如何被克服的(通常在您的“研究局限”一章中讨论)。这将有助于验证结果。

一个深思熟虑的方法部分是期刊稿件中最重要的部分之一,其中研究数据是关键,现在美国大于50万美元的研究项目在申请基金时都必须提交研究数据管理计划(data management plan),研究成果出来后,有些出版商也要求提供研究数据以供共享和再使用。