[读书笔记] R语言实战 基本数据管理

Posted VincentCheng

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[读书笔记] R语言实战 基本数据管理相关的知识,希望对你有一定的参考价值。

1. 创建新的变量

mydata<-data.frame(x1=c(2,2,6,4),x2=c(3,4,2,8))
#方法一
mydata$sumx<-mydata$x1+mydata$x2
mydata$meanx<-(mydata$x1+mydata$x2)/2
#方法二
attach(mydata)
mydata$sumx <- x1+x2
mydata$meanx <- (x1+x2)/2
detach(mydata)
#第三种方式
mydata<-transform(mydata,sumx=x1+x2,meanx=(x1+x2)/2)

2. 变量的重编码

连续->类别

错误->正确值

分数->级别划分

3. 变量的重命名

reshape()包中的rename()函数

rename(dataframe, c(oldname=\'newname\',oldname = \'newname\')

4. 缺失值

缺失值:NA(Not Availabe不可用表示)

不可能出现的值:NAN(Not a number, 非数值)

 is.na() 检查是否是缺失值

na.rm= TRUE 在计算之前移除缺失值

na.omit()删除所有不完整的规则

5. 日期值:日期值以字符串形式输入到R,然后转化为以数值形式存储的日期变量

as.Date(x, "input_format")

#日期默认输入格式为yyyy-mm--dd
mydates <- as.Date(c(\'2007-06-22\',\'2004-02-13\'))
#新的输入格式
strDates <-c(\'01/05/1965\',\'08/16/1975\')
dates <- as.Date(strDates,"%m/%d/%Y")
#日期转化为字符型变量
strDates <- as.character(dates)

6. 数据类型转化

7. 数据排序

order() 对数据进行排序, 默认顺序是升序,在排序变量前面添加一个减号就可以得到降序的排序结果

8. 数据集的合并

1). 列合并:向数据框中添加变量 merge(dataframeA, dataframeB, by = \'ID\')

2). 行合并:向数据框中添加观测 rbind()

3). subset()函数 

newdata <- subset(dateframe, conditions, select = c(col1,col2))

4) 抽样函数 sample()

 

以上是关于[读书笔记] R语言实战 基本数据管理的主要内容,如果未能解决你的问题,请参考以下文章

[读书笔记] R语言实战 R语言介绍

《R语言实战》读书笔记-- 创建数据集

《R实战》读书笔记二

[读书笔记] R语言实战 (十四) 主成分和因子分析

[读书笔记] R语言实战 (十三) 广义线性模型

读书笔记——《Maven实战》