R语言数据分析过程
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R语言数据分析过程相关的知识,希望对你有一定的参考价值。
R语言数据分析前期:预处理过程,供自己查阅,欢迎大家指正。
利用R语言导入数据:
taobao<-read.csv("taobao.csv",stringsAsFactors = F)
我最常用到就是read.csv,其中stringsAsFactors=F很重要,不可缺少,否则会大大降低读入效率。
除此外还有read.table,他们分割符不同。
read.table(file(读入的数据名,不在默认路径下的要添加工作路径,注意使用双引号),
header = FALSE(是否将第一行作为每一列的标题),
sep = ""(分割符是什么,table默认“空”,csv默认“,”),
row.names(行名称), col.names(列名称),
as.is = !stringsAsFactors,
na.strings = "NA", colClasses = NA, nrows = -1,
skip = 0, check.names = TRUE, fill = !blank.lines.skip,
strip.white = FALSE, blank.lines.skip = TRUE,
comment.char = "#",
allowEscapes = FALSE, flush = FALSE,
stringsAsFactors = default.stringsAsFactors(),
fileEncoding = "", encoding = "unknown", text, skipNul = FALSE)
导入之后对数据以窗口形式进行查看:
View(taobao)
对导入的表格进行一个基本的统计:
summary(taobao)
以上是关于R语言数据分析过程的主要内容,如果未能解决你的问题,请参考以下文章
R语言使用gganimate包可视化动画点直方图生成过程(dot histogram)在数据遍历的过程中逐步在箱体内堆叠数据点形成最终的点直方图