citespace

CiteSpace学习笔记(二)——数据的获取(科技文献检索)

旧街凉风 提交于 2020-02-27 13:43:43
科技文本数据的采集是分析的基础,当前数据的采集主要是借助科技文献数据库,并采用成熟的文献检索策略进行. 对于科技文本数据而言,索引型数据库通常收录了除正文以外的所有文献信息,而且还增加了数据库本身对论文的分类标引.不同数据库的格式 有一定的差异性.WoS和Scopus的数据结构是最为完整的,Derwent和CSSCI次之,CNKI的完整性最小.CiteSpace分析的数据是以WoS数据为基础的,其他数据库收集的数据都要先经过转换,成为WoS的数据格式才能分析.通常用户收集的文献题录数据都会包含PT(文献类型),AU(作者),SO(期刊),DE(关键词),AB(摘要),CI(机构)以及CR(参考文献). [注]:CNKI下载的数据没有参考文献信息. 一.中文数据采集 1.CNKI数据采集 (1)进入中国知网首页www.cnki.net。 (2)数据检索策略构建 点击首页右上角的”高级检索”,进入高级检索页面.例:选择”来源期刊检索”,在检索框来源期刊中输入”中国安全科学学报”,匹配方式选择”精确”,时间选择”2019”。 (3)得到检索结果并进行初步分析 CNKI检索的结果中包含新闻,会议通知等信息,因此需要在数据收集时删除(为方便手工删除,可以在下载时逐页检查)。点击”学科”、“发表年度”、“基金”、“研究层次”等,可以对数据的分布进行初步的分析。最后,选定记录。 (4

CiteSpace作者共被引图含义详细解析

大城市里の小女人 提交于 2020-02-21 19:14:53
【如:A文献同时引用了C和D作者,此时C和D作者是共被引关系。同时引用这两位作者的文献篇数叫共被引强度,此例共被引强度为1,因为只有文献A同时引用了C和D; 再如:如果A和B文献同时引用了C、D、E作者,此时C、D、E作者是共被引关系,共被引强度为2】。作者的共被引关系会随时间的变化而变化。 下图为我们截取的CSSCI数据库真实数据情况,由图中可知参与作者共被引的是参考文献中的作者,并且仅仅是第一作者。 当我们做作者共被引时,本质是将一篇施引文献的所有参考文献中的第一作者提取出来,转化下表格式: 作者共被引张昊元;陆彩女;江洪;唐义王晓明;袁远明 然后利用软件如CO-OC转化成矩阵,利用各种可视化软件进行作者共被引网络的绘制。 当然,CiteSpace将这个过程进行了内置,我们看不到这个操作过程。 CiteSpace中文翻译引文空间,由此可知其在做引文分析方面是非常具有优势的,因为便捷。 如下,是作者共被引的图谱。 通过该图除获取网络相关指标外,该部分可参考关键词共现网络图谱解读。 CiteSpace关键词共现图谱含义详细解析 还可以获取该领域哪些作者是高影响力作者;哪些作者的研究主题类似【联系紧密的作者研究主题类似】;哪些作者是不同主题的联络者,即哪些作者具有多学科背景或研究领域具有跨学科属性【具有连接两个或多个团体的功能,也可根据中间中心性判定】等

同时处理知网、万方、维普数据库——CiteSpace、Ucinet、Vosviewer等

十年热恋 提交于 2020-02-21 17:43:32
同时处理知网、万方、维普数据库——CiteSpace、Ucinet、Vosviewer等 全网独家[下文有视频教程] 《CiteSpace、Ucinet、Vosviewer、gephi等文献计量与可视化软件同时处理知网、万方、维普数据库》,结果更加客观、科学、权威! 目前,我们利用可视化软件,诸如CiteSpace、Ucinet、Vosviewer、gephi、pajek等处理中文文献时,往往只能处理一个数据库,这就具有局限性了,因为一个数据库往往收集的数据有遗漏,导致结果往往有些偏颇。综合分析多个数据库得出的结果才会更加客观、准确。 比如,我于2019年10月23日分别以中国知网、万方和维普数据库为例,收集邱均平教授计量方面的文献,得到的结果相差非常大。 知网结果: 万方结果: 维普结果[维普没有主题检索字段] 可见,结果相差非常大! 既然如此,为什么已经发表的文章中很少利用三个数据库同时进行综合分析呢? 答案很简单:操作性很难。 为什么呢? 因为尽管目前已经有了诸如Endnote文献管理软件可以去重,但是经过这些软件去重后,导出来的文献格式CiteSpace、ucinet、vosviewer等并不识别,因此仍然无法进行可视化操作。 基于此,本号开发了一个小程序,【CiteSpace多数据库分析】软件,该软件结合Endnote软件,可将知网、万方、维普数据库中的文献进行去重