为科学研究和学习推荐几个谷歌图片网站

谷歌镜像网站,搜集自网络,由其他热心人士所维护的谷歌镜像。阉割版谷歌,过滤了和谐内容,适合科研学习使用。

网址预览

1、gugeji

搜索数据源自谷歌,可用于科研学习等信息搜索使用。

地址:https://gugeji.com/

2、BIRD.S

阉割版谷歌,过滤了和谐内容,适合科研学习使用。优点:备案域名长期稳定。

地址:https://caup.cn/

3、别忘搜索

百度谷歌一起搜,新一代双搜聚合搜索,多重对比聚合联合搜索引擎。

地址:https://www.biewang.com/

谷歌助手

下方扩展,安装.crx 文件到谷歌浏览器,可以成功加速谷歌服务。使用下方扩展需要关闭任何有代理功能的扩展程序,否则容易冲突导致无法使用。

地址:https://googlehelper.net/

专门为科研、外贸、跨境电商、海淘人员、开发人员服务的上网加速工具,chrome内核浏览器专用!可以解决chrome扩展无法自动更新的问题,同时可>以访问谷歌google搜索,gmail邮箱,google+等谷歌产品。

2T:希望对你们有帮助。

历史上最完整的中外文献检索网站!

来源:中外学术情报

编辑:学术君

一、中文文献检索

(一)中文图书

1.鸠摩搜书:https://www.jiumodiary.com/(各类网盘,外链网站检索)2.读秀:https://www.duxiu.com/ (唯一检索到书的内容的强大引擎!)3.超星:https://book.chaoxing.com/(手机软件更好用)4.豆瓣:https://www.douban.com/ (书目必搜)5.淘宝:https://www.taobao.com/ (自费的书可能会出现)6.当当:https://www.dangdang.com/ (查新书;没货的书也有记录)7.孔夫子旧书网:https://www.kongfz.com/ (总有罕见的旧书浮现)8.西林街:https://www.xilinjie.com/(非会员一天只能检索3次,虽然强大,但是给差评!)9.淘宝定制找书:https://item.taobao.com/item.htm?id=557157311736&_u=67qa35q0d28 (读秀上文献传递的书可以一次性找到)

(二)中文论文

1.中国知网:https://www.cnki.net/2.Q博士图书馆:https://lib.qboshi.net/ (淘宝可以买账户,非常便宜。用49元购买永久vip,可以永久登录知网、万方、维普、独秀等网站。)二、港台文献检索

(一)图书

1.香港公共图书馆检索:https://webcat.hkpl.gov.hk/search/query?theme=WEB (香港、台湾等地的图书均能检索,书目信息有限。只支持繁体检索)2.台湾学术书籍数据库:https://books.twscholar.com/Home/Index (全是台湾地区出版的书,书目检索信息有限。繁体简体检索均可,结果一致)3.好读:https://www.haodoo.net/?M=hd&P=welcome (以大众图书为主,可以免费下载)

(二)论文

1.华艺台湾学术文献数据库: https://www.airitilibrary.cn/ (以台湾地区文献为主,包括台湾英文文献。繁简均可,结果一致。建议简体+英文同时检索)2.台湾硕博论文知识加值系统:https://ndltd.ncl.edu.tw/cgi-bin/gs32/gsweb.cgi/ccd=lnGZgC/webmge?mode=basic (硕博论文必用,与第一个互补)3.台湾学术期刊在线数据库:https://www.twscholar.com/Home/Index (论文必用,与第一个互补)4.正大机构典藏:https://nccur.lib.nccu.edu.tw/ (书、会议论文、期刊论文、硕博论文同时检索,但内容十分有限)5.香港文学资料库(香港中文大学图书馆):https://hklitpub.lib.cuhk.edu.hk/index.jsp (香港地区杂志资料,包括老旧杂志,可检索到罕见的资料,并免费下载)三、英文文献检索

(一)英文图书

1.书贼网:https://booksc.org/ (强大到无法想象)2.杰尼西斯图书馆:https://libgen.io/ (下下下!多语言。备用网址:https://gen.lib.rus.ec/)3.亚马逊海外购:https://www.amazon.cn/b/?&node=1403206071&tag=baiduiclickcn-23&ref=pz_ic_AGS_N_17119_8049(新书必用)4.印度电子图书馆:https://www.new.dli.ernet.in/ (里面还有些奇奇怪怪语言的书。)

(二)英文论文

1.EBSCOO发现系统: https://eds.a.ebscohost.com/eds/search/basic?sid=a611a66c-4548-42b0-b8eb-fc6651d80f25@sessionmgr4010&vid=1&hid=4202 (检索相关性最高,最强大。一般图书馆会购买)2.ProQuest:https://search.proquest.com/ (。。。)3.PQDD学位论文:https://search.proquest.com/?_ga=1.236779593.979165390.1491210519 (英文硕博论文必用。一般图书馆会购买)4.JSTOR:https://www.jstor.org/ (提供大量版权过期英文论文的免费下载。主要是免费)5.超星发现系统:https://ss.chaoxing.com/ (可以搜索到大量的英文文献,并且通过邮箱免费传递,工作人员大概一天就将文献发送到邮箱。一些罕见文献竟可通过这个找到。用超星手机软件“学习通”更方便!)6.百度学术:https://xueshu.baidu.com/(近几年真的愈发强大了!)7.谷歌镜像:https://uuu.tn/yxueshu.exe (浏览器访问该地址,绿色免安装程序,仅568kb,超精简,下载至桌面即可)8.虫部落:https://scholar.chongbuluo.com/ (引擎大杂烩,很难搞明白怎么用)9.剑桥学术期刊网: https://www.cambridge.org/core/ (接近废物,勉强一试)10.Springer: https://link.springer.com/ (或许能搜到呢?)四、视频类资料检索网站

(一)电影:

1.看巴士:https://www.kan84.net/ (给这网站跪了)2.电影天堂:https://www.dytt8.net/index.htm(rmvb标准压缩)3.西林街:https://www.xilinjie.com/(网盘搜索)4.天天美剧:https://www.ttmeiju.com/(美剧神速更新) 5.BT兔子:https://www.btrabbit.cc/(种子神器)6.彩虹影院:https://www.caihong.cool/list1(性别研究)7.豆瓣:https://www.douban.com/ (首查详细目录)8.字幕库:https://www.zimuku.net/ (解决电影没有字幕的问题)9.疯狂解析:https://www.v718.com/(VIP视频看不了?不用怕!)

(二)公开课:

1.网易公开课:https://open.163.com/2.超星视频:https://video.chaoxing.com/ (手机软件“学习通”更强大!)3.新浪公开课:https://open.sina.com.cn/4.中国公开课:https://opencla.cctv.com/5.百家讲坛:https://tv.cctv.com/lm/bjjt/五、各类专业检索、学习网站

1.中国国家图书馆:https://www.nlc.cn/ (有海量藏书,可以找淘宝商复印。之前有我有一本印度作家的书,国内只有国家图书馆收藏了,于是找了淘宝一家店铺,很快就快递寄来了。价格略贵,但如果亚马逊海外购就贵死了,而且几个月才发货)2.英语词源词典:https://www.etymonline.com/(顾名思义……可追溯到拉丁语、希腊语)3.山东高校图书馆随书光盘资源联合中心:https://58.194.172.26//index.jsp(海量图书光盘免费下载!)4.书格(古籍图书馆):https://shuge.org/(高清古籍)5.爱思想:https://www.aisixiang.com/(有深度思想的名家文章集萃)6.蓝江教授新浪博客:https://blog.sina.com.cn/u/1412362930(巴迪欧、阿甘本等文章的最新翻译)7.世界马克思主义文库:https://www.marxists.org/(多语种马克思主义全集,包括西马、后马等相关文献)8.中文马克思主义文库:https://marxists.anu.edu.au/chinese/index.html(世界马克思主义文库中文版)9.中国哲学书电子化计划:https://ctext.org/zhs(中国古代典籍免费阅读,阅读界面极其简洁、舒适、方便!)10.东京审判资料库:https://mylib.nlc.cn/web/guest/djsp/index11.哈佛燕京图书馆电子书计划:https://guides.library.harvard.edu/Chinese?utm_source=Library+Staff&utm_campaign=9fca5a7bb3-EMAIL_CAMPAIGN_2017_06_28&utm_medium=email&utm_term=0_4bb25c0228-9fca5a7bb3-26352423#s-lg-box-6321879(查看Digitization Projects条目,全部为open access)12.伦敦书评网:https://www.lrb.co.uk/13.香港《二十一世纪》杂志:https://www.cuhk.edu.hk/ics/21c/cn/introduction.html14.国际汉字及异体字知识库:https://chardb.iis.sinica.edu.tw/15.常用国字标准字体笔顺学习网:https://stroke-order.learningweb.moe.edu.tw/character.do(查繁体字笔画顺序,只支持繁体检索)16.教育部《异体字字典》:https://dict2.variants.moe.edu.tw/variants/trial_ver_info.html17.美国比较文学学会(ACLA)官网:https://www.acla.org/18.海量小语种学习:https://www.fayurumen.com/languages.htm19.CNKI翻译助手:https://dict.cnki.net/20.抗日战争与近代中日关系文献数据平台:https://www.modernhistory.org.cn/index.htm 21.百词斩网页版:https://www.baicizhan.com/ (每日必用的英语大杀器)22.发现值得买:https://www.kiees.com/ (学术减压利器)23.系统之家软件下载:https://www.xitongzhijia.net/soft/(相当安全)24.电驴资源共享:https://www.ed2000.com/(集电影、电子书、音乐、游戏于一体的资源网站)25,日事清:https://www.rishiqing.com/(你理想的工作方式!)(最近更新:2018年4月5日)

首 推

■西文:https://www.worldcat.org/

查找书籍,如今立刻想到的就是它。它与世界众多图书馆有连结。一个关键词下去,通常能检索出相当完整的书目,甚至自动帮你把其他语言版本的书一并带出!此外,还可以注册後用该网站的文献整理保存功能。

PS. worldcat的“cat”是“catalog”,千万别像我一样以为是“世界猫”……

■中文:鸠摩搜书/

一位豆瓣大神制作的鸠摩搜书(介绍在此),很棒。

■学术共同体:

https://www.academia.edu/

不少学者会将自己的研究paper等po到这个网站,大有“学术共同体”的味道。此外,一些学者会在这里不断更新自己的cv乃至研究进程,有心者或能追踪到大咖的学术思考动态。

■学术共同体:

https://scholar.google.com

上面的是搜书,Google则是搜各种形态的文献了。无需多言,倒是它每条文献下的“被引用次数”丶“相关文章”丶“全部版本”三个链接,常常能由此按文索骥找到更多相关文献,它们很可能是我的关键词搜索遗漏的。此外,若你的学校图书馆与Google连结,则Google scholar会直接显示图书馆能否下载该文献。

■如何“追”学术新刊或出版社信息?

SAGE、Brill、香港大学出版社、香港中文大学出版社等学术出版机构的官网,均提供各类电子报订阅服务,可获取最新期刊或书讯。其中,SAGE注册登录后,可选择特定期刊更新提示,对掌握OnlineFirst类文章很有用。

■豆瓣豆列

在豆瓣读书随意检索一本书,可在网页右侧(通常在大图广告下方)看到“以下豆列推荐”字样。此地可能有与你研究相近的同好(or对手(>_<)),也可能有有心人将相关图书“汇编成列”了。 比如这几个豆列都不错:杨奎松推荐现代史硕士生推荐阅读书目、中国城市史研究、记忆研究、Late Imperial ChinaHistory、新文化史;社会文化史。

海外资源(英文为主)

■加州大学出版社eScholarship Editions

提供部分该社出版的学术著述的电子版全书下载。

https://publishing.cdlib.org/ucpressebooks/

■Springer出版社的部分学术书籍可免费下载。打开https://link.springer.com/ ,点击进入图书后,有Download字样即可下载pdf档案。

■Project Gutenberg(古登堡计划)这个计划在持续收录大量已经过了版权期的公版书电子版(包括少量中文书),若寻找之图书系较久远者,此处可能有。

https://www.gutenberg.org/

■library genesis或https://gen.lib.rus.ec/

可搜索的英文书颇多……没话说~

■Harvard University

透过HOLLIS+检索,部分数字化古籍和民国图书可以预览和透过邮箱传输下载PDF。 不熟悉的朋友可参见台湾大学图书馆指引。

■World Digital Library

世界数字图书馆,联合国教科文组织倡议的全球图书、图像、地图等文本的数字化工程,提供中文检索功能。(另据计划参与老师介绍,各国早期提供的版本品质不一,需留心)

台湾资源

■中央研究院馆藏目录

若问台湾谁家图书最土豪,不差钱的中研院当之无愧。他的馆藏检索系统整合了全院所有图书馆(室)的目录。就算不能借出来,也能查到比较完整的书目清单。对国史研究的朋友而言,馆藏的“匪情”研究资料或许有用处。

■台湾大学图书馆丶政治大学图书馆丶台湾师范大学图书馆丶台湾联大馆藏查询(整合清华大学丶交通大学丶阳明大学丶中央大学四校所有文献资源)

除了研究机构外,这三家的书最多,当然我说的是人文社会科学领域啦……

■台湾人文及社会科学引文索引库

不一定能直接下载论文,但能非常全面地掌握一关键词丶领域丶学者或系所的在台湾的学术研究。如果要下载,可以移步华艺,但下载多少则视乎自己机构图书馆的采购情况了。

■国立台湾大学图书馆公开取用电子书系统

“本系统系由台湾大学图书馆建置,主要目的在有系统地征集网络公开取用电子书,并提供检索与浏览功能……已有42,000种之公开取用电子书。”

■“数位典藏国家型科技计划”与“数位典藏与数位学习国家型科技计划”成果网站

现由中央研究院数位文化中心营运,是21世纪初台湾两个重要数字典藏计划的成果网站,可检索资料广泛,尤适合台湾研究丶历史学、人类学和考古学等研究领域。

■臺灣博碩士論文知識加值系統

台湾硕博学位论文官方保存机构。注册后,开放下载者可下全文。未开放者至少可看中英文摘要、目录和参考书目。

■华艺线上图书馆

可理解为台湾的“知网”,收录台湾主要学术期刊论文和学位论文。下载权限视乎所在机构购买情况。 ■此外,亦可使用臺灣人文及社會科學引文索引資料庫臺灣期刊論文索引系統两个索引系统检索。此两个系统还提供论文主题分析功能,不错。

臺灣書目整合查詢系統(SMRT)和全國圖書書目資訊網(NBINet)聯合目錄系統

可供检索台湾各大公共图书馆和大专院校图书馆馆藏情况,在台者找偏门书可用此两个系统。

■國科會人文及社會科學發展處圖書著錄系統

台湾科技部设置“补助人文及社会科学图书计划”供各高校老师申请,系统会公开历年各学门计划总采购书目。可视为是各领域的参考书单。一般情况,主持人所在高校图书馆网站亦会制作相关网页供使用者参考。

大陆资源

■大名鼎鼎的读秀

无需多言,有多好,谁用谁知道。个人觉得它还有一点牛逼,民国不少文献也都能搜出全文。对不在大陆或CNKI没买全的人来说,下学位论文,读秀也是好去处。 评论区菊菊还有大法补充,别忘了。

■全国图书馆联盟

注册后就可以用,比大学和研究所购买的读秀库弱一点(全文搜索算法不行)。比省市级购买的读秀库强一点,预览和传递的页数限制略多。(感谢豆友俞晓之提供信息)

■国家哲学社会科学学术期刊数据库

虽每日有一定下载限制,但对一时木有知网的人来说,这已经是器大活好的大神器了。

■中山大学图书馆古籍开放平台

(2017年6月上线的新平台)

■百度云/360网盘

■新浪爱问

(现已复活,资料也许会陆陆续续回来吧)

■超星也可以。 ■上述部分资源(如百度云)并不提供全网搜索服务,此时,便可召唤出大神鸠摩搜书帮忙咯。

■“资料库”网站

对没有条件使用读秀或各报刊历史数据库的童鞋,这个网站提供了《人民日报》和《参考消息》的全文,可依出版时间查询,可惜检索功能似乎已挂。

香港、澳门资源

■香港中央图书馆香港旧报纸(免费)

收录了大公报丶香港工商日报等大量香港本地中英文报纸之电子档案。

■香港电影资料馆馆藏网上目录

可使用姓名丶片名丶主题和机构等关键词检索该馆现藏电影。

■香港中文期刊论文索引(HKinChiP)

由香港中文大学建置,提供约1980年至今在香港出版的中文或双语期刊索引,检索功能面向所有人士开放,但全文浏览有权限规定。

■澳门期刊论文索引

(UM Digital Library Portal)

由澳门大学图书馆建置的澳门期刊论文索引系统,亦参见:港澳期刊网。

■HKALL(港書網)

香港八所专上学校的图书馆联合目录(香港中文大學圖書館、香港城市大學圖書館、香港教育大學圖書館、香港浸會大學圖書館、香港理工大學圖書館、香港科技大學圖書館、嶺南大學圖書館、香港大學圖書館)

■香港中文大学特藏

(special collections)

包括:档案检索目录(archival collections)、手稿清单(包括待整理者)、善本。 提供两种分类目录:主题馆藏(以学科分类为主)、汉语拼音次序目录。

■香港浸会大学特藏在华人基督教和当代中国研究等方面,有较多材料。部分已建置的数据库可见:

https://library.hkbu.edu.hk/sca/index.html

如何找到即将出版的新书

■浙江省新华书店芸台购

■部分出版社有豆瓣小站,会定期制作新书豆列如北京大学出版社、后浪出版、三联、商务印书馆等。

图像、地图(舆图)资源

■Stefan R. Landsberger教授创立的网站,收录以1949年以后社会主义中国的海报和宣传画为主。无法下载大图且图像具有水印,但图文资料颇全。此外,还提供了研究资源指南。

https://chineseposters.net/index.php

■空愁士的博客

此博客地图资源不少,且有做基础性分类。浏览一遍应能找到所爱。

https://blog.sina.com.cn/kcj

■书格网

这是个功德无量的网站。整理收录了大量高清的古籍资源。对古籍中图像的重视,是这个网站一大特色。

■Visualising of China 1850-1950: an interactive resource

JISC、AHRC、university of bristol和British Academy共同建置的中国老照片数据库。检索方便,图像信息完整,且可自由获取较大的图像版本。

Mr. Armstrong夫妇1980年代来华拍摄的照片合集(约1600多张),涉及杭州、北京、上海、天津和香港等地。

https://zampras.tuchong.com/12738947/

■法国国家图书馆数字图像检索

输入英文或法文关键词即可检索,可浏览与下载大图或pdf档案。效果如下图。

■中央研究院數位文化中心「數位方輿」成果

良心与无私!公布了美國國會圖書館和大英圖書館的明清舆图近300幅,图像极为清晰、说明详细,且可无偿下载。可配合图录《方輿搜覽-大英圖書館所藏中文歷史地圖》和《皇輿搜覽-美國國會圖書館所藏明清輿圖》一并参考。

■台北故宫博物院Open Data

提供台北故宫博物院馆藏文物图像下载,现有约七万张图像。

■https://www.davidrumsey.com/home

七万多张可以下载的地图。

■香港科技大学古籍及特藏阅览区

https://lbezone.ust.hk/rse/

中国古地图(至1949年以前)以及沙飞摄影作品,很有特色。提供高像素画面。

整理贴及其他资源

■中国(汉学)研究开放获取学术资源集

https://www.douban.com/note/528905271/

■Kindle 电子书资源网站及网盘15G资源汇总(持续更新)

https://www.douban.com/note/525938172/

■sanbilly老师整理的资源贴,以历史学,特别以医疗、科技和环境史为主。

https://www.douban.com/note/586062344/

■Oxford Bibliographies

牛津大学出版社制作的注解书目数据库,有持续更新,是博士生资格考试的好工具。但若想完整使用,就得怂恿大学图书馆采购咯。

■全国图书馆文献缩微复制中心影印书目

https://www.douban.com/note/461317664/

其他实用工具

■中央研究院兩千年中西曆轉換

https://www.davidrumsey.com/home

来源:中外学术情报、孔夫子旧书网、历史研习社。

我有关于深入学习方向的论文的想法,但如果我不能确定工程实践和实验,该怎么办?

作者丨Giant、叶小飞

来源丨知乎问答

原问题背景:本人7月份才接触现在的课题,看了将近40多篇相关英文文献了吧,有了几个idea,开组会,老板们也通过了,接下来就是实现idea,可是自己之前没有接触神经网络方面的,现在要改实验代码,觉得好难啊,是一块硬石头。快泄气。。但是没有退路,必须得做。因为没有正反馈,所以总是很打击自己…… 自我怀疑,我都自闭了。。但是,同时也告诉自己,别人也是从不会到会,从无到有。广大的知友们,有没有什么好的建议,让我可以少走点坑,顺利一点…

原问题链接:https://www.zhihu.com/question/348376942

# 回答一

作者:Giant

来源链接:https://www.zhihu.com/question/348376942/answer/1917476012

去年五一,我正在洛阳旅行,本已收到了腾讯公司的offer,准备假期过后去实习。这时候导师突然来了电话,让我6月份回实验室做科研。

一瞬间我觉得自己好悲惨,大厂实习泡汤了,研究生最后一段自由时光也成了泡影。

科研的主题是Text2SQL,就是把一句话翻译成对应的SQL语句。这是我毕业的开题方向,当初对NLP这个朝阳领域很感兴趣,有几个不错的idea。可我也就止步于此,没尝试过代码实现,看的论文不到10篇,处境很尴尬。

放弃了实习的念头,我在6月底重回实验室后,经历半年多我终于对Text2SQL领域有了清晰的认识。完成毕业论文的同时,产出了paper和专利,并在10月份获得了耶鲁大学Text2SQL比赛的全球第二名。

从开始的懵懂、工程能力不足到最终收获了还不错的结果,我对这半年多经历用了3个方面来概括:

  1. 阅读领域内近3-5年顶会论文
  2. 站在巨人的肩膀上,强化工程能力
  3. 充分利用学校和实验室资源

一、阅读领域内近3-5年顶会论文

阅读已有工作是开展科研的必经之路,既是为了站在一个制高点饱览研究领域这块蛋糕,也是为了提升学术嗅觉与idea能力。同时,可以避免想出了一个很好的idea立即开始复现,结果提交论文时才发现,这个点早就被别人做掉了的极端现象。

高效收集paper的4个途径:

1)在研究领域的公开赛事或榜单上学习Top名次的解决方案(一般都有相应的论文链接)。比如Text2SQL领域有:WikiSQL、TableQA、Spider、CoSQL等比赛,里边有大量值得学习的paper。

2)收集2-3篇综述论文。一篇好的综述概括了该领域的整体进展、已有工作以及潜在的研究方向等等,能够给予我们启发,事半功倍。

3)在谷歌学术上通过关键词搜索相关论文。论文质量可以根据引用数量、会议等级来衡量。

点击某一篇文章的 “被引用次数” 链接,可以跳转进入引用了这篇论文的界面,继续寻找有价值的论文。很多论文其实没有精读的必要,我们在收集了一批论文后,不妨先读读摘要、实验、结论部分,再确定是否需要通篇精读,以提高效率。

当然一些经典的paper是一定要看的,比如做NLP肯定不能错过Transformer、BERT等等。

4)在Github上搜索资源整合项目。如果这个领域比较热门或者正处于上升期,一般都会有热心用户分享自己整理的资料。例如,关于Text2SQL我已经整理好了一份大礼包,包含了背景、论文、数据集、解决方案、应用案例等内容,帮助感兴趣的小伙伴们节省时间:https://github.com/yechens/NL2SQL

二、站在巨人的肩膀上,强化工程能力

有了学术积累和idea后,就需要快速复现idea。刚开始我有一个误区:科研一定要从0做到1。

后来导师告诉我大可不必这样。聪明的人会先参考别人的解决方案(特别是SOTA),在学习过程中强化工程和coding水平,形成更优雅的代码风格。这就像站在巨人的肩膀上,我可以基于他们的工作实现自己的想法,取其精华,去其糟粕。

还是以Text2SQL为例。这个任务的数据处理部分特别繁琐,需要同时考虑文本和数据库信息,仅预处理就包含了上千行代码。我参考了Spider上的Top方案后,发现大家在这部分有很多思路是共通的,完全可以借鉴。这样一来,我可以把更多精力放在模型结构设计和后处理上,这两者对最终结果有关键影响。

有的同学表示说,“自己之前没有太多接触神经网络,现在要改实验代码,觉得好难”,这就涉及基本功问题了。我们每天需要额外挤时间来补漏洞,提升自己的coding能力。

如果喜欢看书,我推荐Keras之父的《Python深度学习》和李沐老师的《动手学深度学习》。两本书我都认真看过,非常经典和通俗易懂。

三、充分利用学校和实验室资源

最后一个关键是学会充分利用现有资源,这个资源包括学术资源、人力资源、硬件资源。

学术资源

最直接的学术资源就是实验室的师兄师姐们,还有大Boss——导师。

师兄中肯定有人发过paper,无论是写作还是关于编程和技巧,和他们聊过之后都给我带来了启发。导师是我研究领域中的权威人物,可以帮助我把关idea是否work、是否有足够的竞争力,甚至在没有任何思路的时候点醒我,提供有价值的idea。

人力资源

导师精力有限,往往神龙见首不见尾,不可能顾及所有人,所以带领学弟学妹们的工作一般留给了高年级同学。如果研究的方向他们也感兴趣,大家完全可以一起合作。例如让coding能力强的师弟帮忙做一些实验,coding弱些的同学分析数据和badcase,便于我迭代模型。不仅让他们有所收获,也帮助我分担了很多工作量,一举多得。

如果能带学弟学妹们投中论文,我想他们一定会从心里发出感激的,没准也更愿意在今后的工作中加上我的名字。

硬件资源

俗话说巧妇难为无米之炊,做科研有了idea和coding能力,没有机器也还是白搭。所以无论是在实验室还是公司,要善于利用资源。

我在实验室时,老板很慷慨的采购了服务器,还有Tesla V100显卡让我们做实验。实验室24h可以进出,提供免费饮用水和咖啡。如果做出了成绩(比如会议中稿,比赛拿下SOTA)会有丰厚的物质奖励。

如果实验室没有这些硬件资源,应该主动和老板沟通,请他帮忙协助解决。

总结

路漫漫其修远兮,吾将上下而求索。

做科研是一条艰辛的路,特别是从0到1的过程。但是通向光明之路,从来没有一帆风顺的选择。

为了避免拖延症和摸鱼,我会给自己罗列各个阶段的deadline,然后从学术调研、coding实验、多次迭代方面进行攻坚。如果真的感觉很累,我会停下来离开实验室,去球场和朋友打球;或者跑跑步,呼吸新鲜空气,让自己清醒放松。

最后推荐几个深度学习方向科研工作的神器吧,希望能为同学们的科研道路提供帮助:

arxiv:论文收录网站(防止自己的idea被剽窃,完成论文后可以先挂上去,证明原创性);

PaperwithCode:论文和代码的结合工具,包含了很多NLP、CV方向的SOTA论文和模型实现;

dblp:计算机英文资料收集网站,支持各种字段搜索(会议、作者、时间等);

Connected Paper:论文引用信息可视化工具,分析出文献的前世今生;

NLPIndex:NLP学术搜索神器,同时链接了paper、code、graph,是上述上个神器的综合体;

Deepl:翻译神器,特点是地道,更接近真人翻译(略胜于谷歌翻译)

diagrams:画图好帮手,制作高大上的流程图、模型图必备,可以在线导出为pdf高清矢量图(放大后图片细节不失真)

  • 参考资料
  • [1] https://github.com/yechens/NL2SQL
  • [2] arxiv: https://arxiv.org/
  • [3] PaperwithCode:https://paperswithcode.com/
  • [4] dblp: https://dblp.uni-trier.de/
  • [5] ConnectedPaper: https://www.connectedpapers.com/
  • [6] NLPIndex: https://index.quantumstat.com/
  • [7] deepl: https://www.deepl.com/translator
  • [8] diagrams: https://app.diagrams.net/
  • [9] Spider: https://yale-lily.github.io/spider

# 回答一

作者:叶小飞

来源链接:https://www.zhihu.com/question/348376942/answer/1923857788

题主和我反着,我一直比较困扰提出很novel的idea, 但我实现idea的速度是很快的,从头搭一个一般复杂的pipeline并调通基本都能控制在一周之内。题主按我这四步走,一定很快就能上道!

第一步:找到baseline

论文一开始对深度学习不熟时,切勿自己蒙着头写代码。既然题主已经看了四十多篇论文,并且有了自己的idea, 那么肯定知道自己要做的方向有哪些前人写下的不错的论文, 从这些论文中挑选出一到两篇作为你的baseline,作为你的代码开端。

一般一个好的baseline有两个特点:

1)它一定有开源代码,而且有较完整的文档(readme)。如果它的github星蛮多的更好,说明很多人用过,质量没问题。

2)它发表的时间是近两到三年的。深度学习的发展速度实在过快,时间久远又没人维护的,它用的代码框架什么的可能会过时,比如我之前做colorization, 有几篇不错的都是用的caffe, 比较难拿来直接用。

3)它里面的公式整体较为清晰,这样方便你对照着代码来看公式,当你明白了如何把理论的公式转化为代码时,你基本就上道了。

第二步:深入baseline代码

当你找到了不错的baseline论文后,就要深入阅读、使用它的代码了。在你基础较差时,提高代码能力最好的方法绝对不是头铁地去楞写,而是阅读别人写的优质代码。 阅读代码也是有诀窍的,一般分为这么几步:

  1. 按照github的文档配置好你的环境。 几年前配置环境其实是个蛮痛苦的事,那时候我还用caffe,简直就是噩梦,但现在配置环境变得特别傻瓜式,pytorch/tf都特别好配置。
  2. 配置好环境后,按它readme的步骤下载相应的数据,运行相应的脚本,让它的训练先能流畅地跑通。 优质的开源代码基本都能跑通,如果在中间报了错,一般都是library版本不符。但如果是涉及到算法内部的问题,就要走到下一步了。
  3. 当你把开源代码跑起来或者遇到算法里的bug之后,用一个好的ide(例如pycharm)进入debug模式。 在这个模式下的最大好处,就是你可以拿着实际的数据一步一步看代码,哪一步看不懂就对照论文的流程加谷歌一下API的使用方法,很多你干看看不懂的代码结合着tensor shape或者处理过后的数据的shape/value就能看懂。在这一步一步debug运行代码的过程里, 其实你对深度学习完整的pipeline怎么写基本就有了一个比较好的认识。 如果时间允许,建议把你找到的几篇baseline都这样跑一遍,并且写个笔记记录下大概流程。

第三步:搭建你自己的pipeline

我一般喜欢根据自己特定的任务从头搭建整个pipeline(包括数据I/O, 预处理,模型搭建,loss定义、训练与验证、测试等等),但鉴于题主刚接触深度学习代码,可以从第二步中挑选一个不错的baseline作为你的基础代码,站在它的肩膀上进行修修剪剪。一般你要做的方向虽然可以用baseline的算法,但数据集往往不同,所以在别人的基础上搭建自己的pipeline最重要的是修改数据读取和预处理部分。在这一步先不要把自己的模型加进去,用baseline的模型能跑通你自己的数据即可。

第四步:将你的核心算法融入pipeline

经过了上面三步之后,你已经对深度学习训练预测的流程有了一个比较清晰的认识,这个时候可以开始把你自己的idea加入pipeline. 一般来说你的idea无非是提出了更好的模型,或者更好的训练机制。模型或者loss你在网上一般都能找到整体架构较为类似的代码,比如你要做轻量级图像分割,那大概率可以借鉴Unet,网上一搜一大堆,按照他们的格式仿写即可。这里有个小诀窍,你搭建自己的模型搭好后可以先不放入自己的pipeline里真枪实战的训练,先生成几个随机的tensor扔进去做inference, 看看能不能跑通,输出的shape是否正确。

最后一点点建议,新手想快速入门首选pytorch, tf1.x对新手挺不友好的,而用tf2的研究人员比较少,容易找不到现成的代码。