R语言实战应用精讲50篇(十八)-R语言实现分词词频与词云案例解析

Posted 文宇肃然

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R语言实战应用精讲50篇(十八)-R语言实现分词词频与词云案例解析相关的知识,希望对你有一定的参考价值。

前言

我真的超爱R语言,原因之一就是R有许多已经写好、“开箱即用”的程序包可以直接拿来用;要知道,程序包减少了多少工作量。当然,其他语言也有类似的包,但是貌似没那么多、没那么细。这一期咱就要用jiebaR包、sqldf包和wordcloud2包完成中文文本的分词、词频统计与绘制词云图的工作。首先设置工作目录:可以通过R-Gui的“文件-改变工作目录”菜单完成,也可以通过以下代码;设置工作目录的意义是,你的所有数据和结果都在该目录下面,找文件时候就不会慌乱:

# 设置工作目录

setwd("D://text_analysis")

中文分词:jiebaR包

    注意1:jiebaR包依赖于jiebaRD包,所以先要安装jiebaRD包;中文分词包还有Rwordseg包、tmcn包等,这里不做介绍,读者可以自行探索:

# 安装jiebaRD包并调用

install.packages("jiebaRD")

library(jiebaRD)

# 安装jiebaR包并调用

install.packages("jiebaR")

library(jiebaR)

以上是关于R语言实战应用精讲50篇(十八)-R语言实现分词词频与词云案例解析的主要内容,如果未能解决你的问题,请参考以下文章

R语言实战应用精讲50篇(二十八)-R语言时空数据分析实战案例-数据处理及可视化

R语言实战应用精讲50篇(二十八)-R语言时空数据分析实战案例-数据处理及可视化

R语言实战应用精讲50篇(二十八)-大量代码示例带你从基础到高级(附R语言代码)

R语言实战应用精讲50篇(三十一)-R语言实现决策树(附R语言代码)

R语言实战应用精讲50篇(三十二)-R语言实现单变量时间序列(附R语言代码)

R语言实战应用精讲50篇(三十五)-R语言实现xgboost回归(附R语言代码)