R语言数据处理应用
Posted 谁说菜鸟不会数据分析
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R语言数据处理应用相关的知识,希望对你有一定的参考价值。
大家好,我是菜鸟君。今天给大家分享一下怎么用R语言来进行基础的数据处理。
R代码和思路都列出来了,咱们一步步来。
首先,数据大致长下面这个样子,对,就是一行,是10个人4天分别的花销金额:
问题1:实现每行10人的记录,并计算每天每人的花销金额
首先设置工作路径
setwd("C:\\Users\\Desktop")
用read.table读取txt数据
dat <- read.table("data.txt",header = F,sep=",")
查看数据结构
str(dat)
也可以看看数据长啥样
dat
把一行数据变成4行,每行10个人,按照row排列
dat2 <- data.frame(matrix(dat,nrow = 4,ncol = 10, byrow = TRUE))
看看这个数据的行列数
dim(dat2)
把数据变成数值型
dat2 <- apply(dat2,2,as.numeric)
计算每列的和
colsum <- colSums(dat2)
把每列的和合并到dat2的最后一行
dat2 <- rbind(dat2,colsum)
问题2:筛选出花销总额大于3元的小伙伴
把dat2的行列对调
dat3 <- t(dat2)
确保行列对调后的dat3是个数据框
dat3 <- data.frame(dat3)
在dat3创建一列pred,暂时设定全部值为1,这个值不重要
dat3$pred <- 1
写个for循环,遍历dat3的每一行,再结合if else判断语句
for (i in 1:nrow(dat3)){
if (dat3[i,]$colsum > 3){
筛选花销大于3元的小伙伴,pred标签为1,否则是0
dat3[i,]$pred <- 1}else{
dat3[i,]$pred <- 0}}
最后,想看看有多少小伙伴花销大于3,把pred这一列求和就行
sum(dat3$pred)
么么哒(づ ̄ 3 ̄)づ
数据集还有code在群里哟~
以上是关于R语言数据处理应用的主要内容,如果未能解决你的问题,请参考以下文章
R语言实战应用精讲50篇(十五)-R语言如何实现数据的导入导出操作
R语言实战应用精讲50篇(二十八)-R语言时空数据分析实战案例-数据处理及可视化
R语言实战应用精讲50篇(二十八)-R语言时空数据分析实战案例-数据处理及可视化