citespace | 易学教程

CiteSpace学习笔记（二）——数据的获取（科技文献检索）

阅读更多关于 CiteSpace学习笔记（二）——数据的获取（科技文献检索）

科技文本数据的采集是分析的基础,当前数据的采集主要是借助科技文献数据库,并采用成熟的文献检索策略进行. 对于科技文本数据而言,索引型数据库通常收录了除正文以外的所有文献信息,而且还增加了数据库本身对论文的分类标引.不同数据库的格式有一定的差异性.WoS和Scopus的数据结构是最为完整的,Derwent和CSSCI次之,CNKI的完整性最小.CiteSpace分析的数据是以WoS数据为基础的,其他数据库收集的数据都要先经过转换,成为WoS的数据格式才能分析.通常用户收集的文献题录数据都会包含PT(文献类型),AU(作者),SO(期刊),DE(关键词),AB(摘要),CI(机构)以及CR(参考文献). [注]:CNKI下载的数据没有参考文献信息. 一.中文数据采集 1.CNKI数据采集（1）进入中国知网首页www.cnki.net。（2）数据检索策略构建点击首页右上角的”高级检索”,进入高级检索页面.例:选择”来源期刊检索”,在检索框来源期刊中输入”中国安全科学学报”,匹配方式选择”精确”,时间选择”2019”。（3）得到检索结果并进行初步分析 CNKI检索的结果中包含新闻,会议通知等信息,因此需要在数据收集时删除(为方便手工删除,可以在下载时逐页检查)。点击”学科”、“发表年度”、“基金”、“研究层次”等，可以对数据的分布进行初步的分析。最后，选定记录。（4

CiteSpace作者共被引图含义详细解析

阅读更多关于 CiteSpace作者共被引图含义详细解析

【如：A文献同时引用了C和D作者，此时C和D作者是共被引关系。同时引用这两位作者的文献篇数叫共被引强度，此例共被引强度为1，因为只有文献A同时引用了C和D；再如：如果A和B文献同时引用了C、D、E作者，此时C、D、E作者是共被引关系，共被引强度为2】。作者的共被引关系会随时间的变化而变化。下图为我们截取的CSSCI数据库真实数据情况，由图中可知参与作者共被引的是参考文献中的作者，并且仅仅是第一作者。当我们做作者共被引时，本质是将一篇施引文献的所有参考文献中的第一作者提取出来，转化下表格式：作者共被引张昊元;陆彩女;江洪;唐义王晓明;袁远明然后利用软件如CO-OC转化成矩阵，利用各种可视化软件进行作者共被引网络的绘制。当然，CiteSpace将这个过程进行了内置，我们看不到这个操作过程。 CiteSpace中文翻译引文空间，由此可知其在做引文分析方面是非常具有优势的，因为便捷。如下，是作者共被引的图谱。通过该图除获取网络相关指标外，该部分可参考关键词共现网络图谱解读。 CiteSpace关键词共现图谱含义详细解析还可以获取该领域哪些作者是高影响力作者；哪些作者的研究主题类似【联系紧密的作者研究主题类似】；哪些作者是不同主题的联络者，即哪些作者具有多学科背景或研究领域具有跨学科属性【具有连接两个或多个团体的功能，也可根据中间中心性判定】等

同时处理知网、万方、维普数据库——CiteSpace、Ucinet、Vosviewer等

阅读更多关于同时处理知网、万方、维普数据库——CiteSpace、Ucinet、Vosviewer等

同时处理知网、万方、维普数据库——CiteSpace、Ucinet、Vosviewer等全网独家[下文有视频教程] 《CiteSpace、Ucinet、Vosviewer、gephi等文献计量与可视化软件同时处理知网、万方、维普数据库》，结果更加客观、科学、权威！目前，我们利用可视化软件，诸如CiteSpace、Ucinet、Vosviewer、gephi、pajek等处理中文文献时，往往只能处理一个数据库，这就具有局限性了，因为一个数据库往往收集的数据有遗漏，导致结果往往有些偏颇。综合分析多个数据库得出的结果才会更加客观、准确。比如，我于2019年10月23日分别以中国知网、万方和维普数据库为例，收集邱均平教授计量方面的文献，得到的结果相差非常大。知网结果：万方结果：维普结果[维普没有主题检索字段] 可见，结果相差非常大！既然如此，为什么已经发表的文章中很少利用三个数据库同时进行综合分析呢？答案很简单：操作性很难。为什么呢？因为尽管目前已经有了诸如Endnote文献管理软件可以去重，但是经过这些软件去重后，导出来的文献格式CiteSpace、ucinet、vosviewer等并不识别，因此仍然无法进行可视化操作。基于此，本号开发了一个小程序，【CiteSpace多数据库分析】软件，该软件结合Endnote软件，可将知网、万方、维普数据库中的文献进行去重