R语言数据处理应用

Posted 谁说菜鸟不会数据分析

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R语言数据处理应用相关的知识,希望对你有一定的参考价值。

大家好,我是菜鸟君。今天给大家分享一下怎么用R语言来进行基础的数据处理。

R代码和思路都列出来了,咱们一步步来。


首先,数据大致长下面这个样子,对,就是一行,是10个人4天分别的花销金额:

  • 问题1:实现每行10人的记录,并计算每天每人的花销金额


首先设置工作路径

setwd("C:\\Users\\Desktop")


用read.table读取txt数据

dat <- read.table("data.txt",header = F,sep=",")


查看数据结构

str(dat)


也可以看看数据长啥样

dat


把一行数据变成4行,每行10个人,按照row排列

dat2 <- data.frame(matrix(dat,nrow = 4,ncol = 10, byrow = TRUE))


看看这个数据的行列数

dim(dat2)


把数据变成数值型

dat2 <- apply(dat2,2,as.numeric)


计算每列的和

colsum <- colSums(dat2)


把每列的和合并到dat2的最后一行

dat2 <- rbind(dat2,colsum)


  • 问题2:筛选出花销总额大于3元的小伙伴


把dat2的行列对调

dat3 <- t(dat2)


确保行列对调后的dat3是个数据框

dat3 <- data.frame(dat3)


在dat3创建一列pred,暂时设定全部值为1,这个值不重要

dat3$pred <- 1


写个for循环,遍历dat3的每一行,再结合if else判断语句

for (i in 1:nrow(dat3)){

if (dat3[i,]$colsum > 3){

筛选花销大于3元的小伙伴,pred标签为1,否则是0

dat3[i,]$pred <- 1}else{

dat3[i,]$pred <- 0}}


最后,想看看有多少小伙伴花销大于3,把pred这一列求和就行

sum(dat3$pred)


么么哒(づ ̄ 3 ̄)づ

数据集还有code在群里哟~


以上是关于R语言数据处理应用的主要内容,如果未能解决你的问题,请参考以下文章

R语言基本数据分析

R语言实战应用精讲50篇(十五)-R语言如何实现数据的导入导出操作

R语言实战应用精讲50篇(二十八)-R语言时空数据分析实战案例-数据处理及可视化

R语言实战应用精讲50篇(二十八)-R语言时空数据分析实战案例-数据处理及可视化

R语言实战应用精讲50篇(二十九)-数据可视化应用案例(附R语言代码)

R语言实战应用精讲50篇(三十一)-R语言入门系列-tidyverse数据分析流程