r 中数据集的最大值和最小值

Posted

技术标签:

【中文标题】r 中数据集的最大值和最小值【英文标题】:Maximum and minimum value of a dataset in r 【发布时间】:2013-06-05 21:34:15 【问题描述】:

您好,我是 r 新手,我必须在下面解决这个问题

将每个组(因子水平)内的最大值和最小值与它们的值进行比较 各自的组手段。你的一个之间最大的绝对差异是什么 值及其组是什么意思?假设获得这样一个值的机会是多少 数据呈正态分布,并以相应的组均值为中心 标准差为 1?

数据集和框架由

生成
  fact<-rep(c("E","F","G","H"),each=12)
  variable2=rnorm(48,10)*(rep(rpois(4,.2),each=12)/8+1)
  ds<-data.frame(fact,variable2)

任何帮助将不胜感激

这是我尝试过的

library(“plyr”)
ddply(ds,~fact,summarise,maximum=max(variable2),min=min(variable2),mean=mean(variable2))

【问题讨论】:

除了你试过的,还有什么不行? 也许是个愚蠢的问题,但你跑过library("plyr") 了吗? Steph 感谢运行代码尝试使用库(“ggplot2”)。是否有用于回答下一个问题的语法?您的一个值与其组均值之间最大的绝对差异是多少?假设数据呈正态分布并以各自的组均值为中心,标准差为 1,那么获得这样一个值的机会是多少? @Diin 太好了,您现在应该可以发布更新以消除 ddply 错误消息。计算出平均值后,您应该能够将汇总表与原始数据集连接/合并,以获得值和平均值之间的差异。 @StephLocke 你能帮我解决第二个问题吗? 【参考方案1】:

你快到了。 dnorm 函数将在这里为您提供帮助

res <- ddply(ds, ~fact , 
                summarise , 
                maxi = max(variable2) - mean(variable2),
                mini = min(variable2) - mean(variable2) )

res$probmax <- dnorm( res$maxi )
res$probmin <- dnorm( res$mini )
#  fact      maxi      mini    probmax      probmin
#1    E 1.7736537 -1.622157 0.08275571 0.1070311818
#2    F 1.7733593 -2.269254 0.08279894 0.0303883803
#3    G 2.6621257 -3.708242 0.01153470 0.0004120085
#4    H 0.8461922 -1.749625 0.27888407 0.0863339664

【讨论】:

以上是关于r 中数据集的最大值和最小值的主要内容,如果未能解决你的问题,请参考以下文章

R语言使用caret包的predict函数对模型在测试集上的表现进行推理和预测predict函数对测试数据集进行数据预处理(和训练集的初始方式保持一致):缺失值填充数值变量最小最大缩放独热编码

R中数据集中具有最小值和最大值的列名

R中具有数据框的每一行的最小值和最大值

如何在 r 中绘制最小值、最大值和平均值

R语言 箱线图

R语言使用Which.max和Which.min函数定位数据对象中的第一个最大值或最小值实战:使用which.max函数查找第一个最大值的索引使用which.min函数查找第一个最小值的索引