文本挖掘:互联网研究现状分析

Posted sociology前沿论文大推送

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了文本挖掘:互联网研究现状分析相关的知识,希望对你有一定的参考价值。

(这是社论·社会学小组第23次推送)


摘要

作为一个社会科学研究领域,近十多年勃发的“互联网研究”做什么? 本期推送Tai-Quan Peng(澳门科技大学), Lun Zhang(香港城市大学和), Zhi-Jin Zhong(中山大学) Jonathan JH Zhu(香港城市大学)等学者于2012年在New Media & Society5期上发表的Mapping the landscape of Internet studies: Text mining of social science journal articles 2000–2009一文。作者以文本挖掘法分析了20002009年间SSCIA&HCI两个数据库中的27000多篇文献,勾勒出互联网研究的主题、理论和方法的图景,以回答上述问题。探讨的问题包括:

(1)一般而言,互联网研究的现状是什么?

(2)互联网研究的主题有哪些?

(3)每个互联网研究主题中的流行关键词有哪些?

(4)这些流行关键词随着时间如何变化?

(5)互联网研究的主流理论取向和研究方法是什么?


方法

准备工作

数据库:The Social Sciences Citation Index (SSCI) and Arts & Humanities Citation Index (A&HCI)

检索时间:20109

检索时限:20002009

检索词:Internet, web, cyberspace, cyber-space, online, and on-line

检索范围:标题、摘要、关键词

检索文献:英语学术期刊论文

检索结果:获得文献27340篇,获取作者、文章标题、摘要、关键词和参考文献等内容。


分析策略

在分析这些文章过程中,作者采用自下而上的方法——在没有事先确定任何分类的情况下区分出互联网研究的关键词——以确定其界限,主要分支和基本要素等领域现状。具体分析方法如下:

首先,采用聚类分析(两步聚类分析,two-step cluster analysis)摘要中的文字,以此获取研究主题;

其次,采用单词共生网络分析(word co-occurrence network’ analysis)确定互联网研究中的流行关键词(注:若有兴趣,上述聚类分析和单词共生网络分析方法读者可以在百度自行搜索了解);

第三,为探索流行关键词的演变趋势,作者分析了2000-2002年与2007-2009年两个时期所选特定作者使用的关键词其起伏变化,即前三年和后三年关键词的出现频次假定为两个构成来源。根据两个时期总的词频排序的变化,这些关键词可以分为四类:总受欢迎型、冉冉上升型、渐渐消失型和边缘型。


分析结果

作者指出研究发现有意料之中的,也有意料之外的模式和趋势。互联网研究已经推进到了一个被证明繁荣了十几年的可行状态。该领域的主要研究主题可以分类为:电子医疗、电子商务、电子社区以及人与技术互动。每个主题出现了两三个带有不同焦点的亚主题。每一个亚主题中流行关键词的演化进一步表明,该领域已经变得更关注互联网的使用与特定行为、态度和影响之间的复杂关系;互联网的使用类型正日益吸引研究者的注意力;网络视角和方法正在变得很流行。互联网研究在过去十几年已经形成了一些理论,现有研究方法(如调查、实验和文本分析)在互联网研究中仍占上风。


点评

这篇文章既是一篇关于互联网研究的文献综述,又展示了文本挖掘的分析方法,希望对互联网研究和文本挖掘有兴趣的读者有所裨益。


参考文献:

Peng, T. Q., Zhang, L., Zhong, Z. J., & Zhu, J. J. (2012). Mapping the landscape of Internet studies: Text mining of social science journal articles 2000–2009. New Media & Society, 1461444812462846.


文献整理:范长煜



社论团队包括社论·社会学小组和社论·社会工作小组,我们旨在追踪海外社会学与社会工作的最新前沿研究,我们希望每天定时来到您身边,为您推送最有价值的论文干货,与您一起成长。

社论团队出品·2015|社会学前沿论文

微信ID:sociology前沿论文大推送



以上是关于文本挖掘:互联网研究现状分析的主要内容,如果未能解决你的问题,请参考以下文章

整合会话分析与文本挖掘技术来评价协作学习——访谈卡耐基梅隆大学著名教授卡洛琳·佩恩斯坦·罗泽

中科院宗成庆谈文本数据挖掘

电子病历文本挖掘研究综述

干货 | 互联网金融之量化投资深度文本挖掘——附源码文档

如何优雅的用十分钟对Pubmed文本挖掘掌握研究现状?

旅游研究院大数据挖掘与分析科研平台建设方案