CiteSpace学习笔记(二)——数据的获取(科技文献检索)
科技文本数据的采集是分析的基础,当前数据的采集主要是借助科技文献数据库,并采用成熟的文献检索策略进行. 对于科技文本数据而言,索引型数据库通常收录了除正文以外的所有文献信息,而且还增加了数据库本身对论文的分类标引.不同数据库的格式 有一定的差异性.WoS和Scopus的数据结构是最为完整的,Derwent和CSSCI次之,CNKI的完整性最小.CiteSpace分析的数据是以WoS数据为基础的,其他数据库收集的数据都要先经过转换,成为WoS的数据格式才能分析.通常用户收集的文献题录数据都会包含PT(文献类型),AU(作者),SO(期刊),DE(关键词),AB(摘要),CI(机构)以及CR(参考文献). [注]:CNKI下载的数据没有参考文献信息. 一.中文数据采集 1.CNKI数据采集 (1)进入中国知网首页www.cnki.net。 (2)数据检索策略构建 点击首页右上角的”高级检索”,进入高级检索页面.例:选择”来源期刊检索”,在检索框来源期刊中输入”中国安全科学学报”,匹配方式选择”精确”,时间选择”2019”。 (3)得到检索结果并进行初步分析 CNKI检索的结果中包含新闻,会议通知等信息,因此需要在数据收集时删除(为方便手工删除,可以在下载时逐页检查)。点击”学科”、“发表年度”、“基金”、“研究层次”等,可以对数据的分布进行初步的分析。最后,选定记录。 (4