一旦确定好了文章的主题,紧接的必定是相关资料的收集和阅读。
当然,在实际中资料的收集时常会伴随着定题过程。
具体的先后关系就不再讨论了,反正明确一点的是,无资料不动笔,肚里有粮,心中不慌。
1.1 文献收集
1.1.1
Google Scholar毋庸置疑,就搜索文献来说,首推的还是谷歌学术,毕竟数据库大而且有的文献能下 Free 的。
另外,在搜索结果中选择引用的话,它会给你提供三种常见引用格式,而且还支持四种参考文献管理软件,方便管理参考文献(吐槽 BibTeX 的导出,有时候会出现文献类别错误)。
1.1.2 /
知网 & 万方对于中文文献来说,知网和万方是不能不提及的。
不过具体不介绍了,毕竟各学校买的数据库都不一样。
只能说,下不了的文献,那就找同(tao)学(bao)下载吧。
当然,与谷歌学术类似,知网也有参考文献导出的功能,有兴趣的可以去试试。
(吐槽知网的文献格式 CAJ,Chrome 上有插件可以下载 PDF 格式)
1.1.3 /等
Elsevier 出版社旗下的 Science Direct Springer 出版社旗下的 Springer Link对于谷歌学术下载不了的外文文献,比较新的一般这几个就能够解决。
前提是首先学校图书馆得买了数据库!真的很贵的这几个。
所以还是万能的。。。。
1.1.4
Sci-Hub对于上不了 404,没有充足的文献数据库的朋友,也许 Sci-Hub 会是一个比较适合你的选择。
Sci-Hub 其网站宗旨是 To remove all barriers in the way of science,其由哈萨克斯坦科研工作者 Alexandra Elbakyan 女士创立的。
虽然网页界面基本为俄文,但是只要你有所需文献的文献的链接或者 DOI 或者 PubMed 号,绝大部分而言,即可轻松免费获取文献。
不过,该站因为知识产权的问题多次被关停,所以网址也经常改变,这里就只放上本篇更新前测试成功使用的网址上来。另外,该站有可能需要挂代理(不过刚才试的时候并没有)。
1.1.5 RSS
最后一个不谈怎么下论文,而聚焦在信息收集上。
RSS 实际上并不是个应用( Wiki 百科具体定义给下面),大概是一个协议之类的东西,虽然过去几年一直在唱衰 RSS,但是其在目前这个信息过载的时代仍有其立足之地。
RSS(简易信息聚合)是一种消息来源格式规范,用以聚合经常发布更新数据的网站,例如博客文章、新闻、音频或视频的网摘。RSS 文件(或称做摘要、网络摘要、或频更新,提供到频道)包含全文或是节录的文字,再加上发布者所订阅之网摘数据和授权的元数据。
Really Simple Syndication “聚合真的很简单”就是 RSS 的英文原意。把新闻标题、摘要(Feed)、内容按照用户的要求,“送”到用户的桌面就是 RSS 的目的。RSS 一词有时候大体上意为社会性书签,包括各种 RSS 的不同格式。例如,Blogspace 对使用网摘于一集成器内之动作标为 RSS info 和 RSS reader。虽然它的第一个句子就包含明确的 Atom 格式:“RSS 和 Atom 文件能够用简单的格式从网站更新消息至你的电脑!”
RSS 摘要可以借由 RSS 阅读器、feed reader 或是 aggregator 等网页或以桌面为架构的软件来阅读。标准的 XML 档式可允许信息在一次发布后通过不同的程序阅览。用户借由将网摘输入 RSS 阅读器或是用鼠标点取浏览器上指向订阅程序的 RSS 小图标之URI(非通常称为URL)来订阅网摘。RSS 阅读器定期检阅是否有更新,然后下载给监看用户界面。
个人相对于今日头条之流还是更加偏好于 RSS。
不可否认这类新闻应用在信息聚合上非常迅速,但是我却始终对其呈现的内容不是很满意。
个人观点 RSS 更加适合长阅读,而且可以比较方便地跟踪你喜欢的网站和个人博客,其中就不乏有充满干货的平台在网络上不断发声。
每天给自己一段时间集中起来阅读这些文章,可能会比你无时无刻打断思路的碎片化推送更为有效。
1.1.5.1
Inoreader1.2 文献阅读
1.2.1
Foxit 阅读器Foxit 为国产佳作,一款较为优秀的 PDF 阅读器,在各平台上都推出了相关产品(WP 的朋友我不清楚),批注也挺好用的。
其实重点是界面好看(捂脸)。
(吐槽 PC 端新版本强制要联网,不然有脚本错误,所以建议用老版本)
1.2.1
EndNote在这里注明一下,同等级标题不意味着应用之间是平行类似的。
EndNote 是一款老牌的文献管理软件,产自汤森路透家。
支持在 Word/LaTeX 里面导出参考文献,是值得去学习的。
(写这么点其实就是我没怎么用过罢了)
1.2.3
ReederReeder 是 Mac/iOS 平台上的 RSS 阅读器,个人比较偏好其极简的设计风格(讲真,界面辣么好看)
阅读观感良好,支持稍后阅读、Evernote(国际版)以及邮件等分享方式。(吐槽不支持印象笔记和 Onenote)
1.3 数据收集
1.3.1 Retuers/Bloomberg/Wind/CEIC
这几款数据库涵盖范围广,各有优劣(这里借用老师的图)。
当然,前提你得有账号。
(学生账号的限制简直烦人!还是去图书馆机房吧)
1.3.2
国家统计局统计局是应该是获取数据最为简单的方式,国家统计年鉴、地区统计年鉴等。
当然,个别部门的数据最好还得去相应的部门网站上去找,例如进出口数据就得去海关总署跑一趟。(不过一般在 Wind 上就能把相应的数据拿到)
同理,其他国家的数据也能在各国统计局网站上获得。
1.3.3 联合国/世界银行等
1.3.4 //
国泰安 & 中经网 & 锐思个人感觉这些数据库对数据整理上还是比较好,而且各家大多都有一些独有的特色数据库。因而查数据往往还是得从多方去查找,说不定哪家就刚好有这个呢?
1.4 获取技巧
1.4.1
虽然说网盘近期一再打击,但是抵挡不住网民的智慧啊。
对于一些书籍资料,其实是可以通过网盘搜索来获取电子版的(不过大多也是从超星什么的流出来的)。
链接仅作为举例,不代表推荐。
1.4.2 网络爬虫
翻遍了数据库也没有找到心仪的数据怎么办?
编写网络爬虫,自己动手,丰衣足食。
网络蜘蛛(Web spider)也叫网络爬虫(Web crawler),蚂蚁(ant),自动检索工具(automatic indexer),或者(在FOAF软件概念中)网络疾走(WEB scutter),是一种“自动化浏览网络”的程序,或者说是一种网络机器人。它们被广泛用于互联网搜索引擎或其他类似网站,以获取或更新这些网站的内容和检索方式。它们可以自动采集所有其能够访问到的页面内容,以供搜索引擎做进一步处理(分检整理下载的页面),而使得用户能更快的检索到他们需要的信息。
这里也就提及一下这个概念,具体不细说。
1.4.3 OCR
这个是从某次统计作业里面发掘的工具。
对于某些数据库(说的就是国家统计局的统计年鉴),有些数据是以图片形式展示出来的。
这个时候你是选择一眼一个地打在 Excel 上面呢,还是选择 OCR 一目十行地直接把信息扫出来?
1.4.3.1
ABBYY FineReaderABBYY FineReader 是来自战斗民族的 OCR 软件,功能及其强大。
识别多国语言,正确率也高,支持导出成 Word 或者 Excel 格式,总之就是棒呆。
最主要的是,新版的界面好看啊(再捂脸)。
原创版权,禁止转载