关于高频关键词共现,ACA(作者同被引)等的范式

Posted liuqiang8650

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了关于高频关键词共现,ACA(作者同被引)等的范式相关的知识,希望对你有一定的参考价值。

这篇随笔是写在看了若干篇关于高频关键词共现和ACA的文章之后的一个总结,这些论文大多是2010年之前发表的,这与这种方法是传统方法有很大关系。同时,这些文章不仅限于图书情报领域。

下面是正文:

①大多数论文用的方法就是崔雷说不太合适的,具体来说是:先用SPSS里的分析--相关--距离--皮尔森系数,将原始共现矩阵转化为相似性矩阵(其实也可以用cosine,许海云的文章就是没用Pearson用的cosine),然后在这个矩阵的基础上进行聚类分析和MDS分析。MDS分析就是用的是得到的矩阵然后操作就是按照http://blog.sina.com.cn/s/blog_49f78a4b0100hr4j.html这个网址里说的,当然其实用原始共现矩阵也可以,这样的话就是完全按照网址里说的。。而因子分析一般是用原始的矩阵进行,就是那种做问卷的因子分析,然而这里就是用之前的那个转化后得到的相关矩阵来做。
②做高频词(关键词)的时候用1去减①里提到的相似矩阵(不过这时候用的是Ochiai系数了结果都是正数的系数)的值得到的结果就是相异矩阵,很好理解,因为相似程度1,相异程度自然就是0。关键词分析的话是用相异矩阵做MDS,用相似矩阵做聚类,用原始共现矩阵做因子分析(这是马费成和张勤写的《国外知识管理研究范式》里说的,发表在07年12月的管理科学学报上)
③皮尔森相关系数矩阵是可以算出负数的,这种情况下应该还是不用管,就是按照①里面说的,进行MDS操作和聚类

以上是关于关于高频关键词共现,ACA(作者同被引)等的范式的主要内容,如果未能解决你的问题,请参考以下文章

Python构建关键词共现矩阵完整版

论文被引情况调研记录

有词篇矩阵和共现矩阵怎么在spss生成聚类树图

高频面试锁与CAS详解(⭐建议收藏)

ESI高被引系列:JFE论文:时间序列动量效应

关于数据库设计的重要性