r 中数据集的最大值和最小值
Posted
技术标签:
【中文标题】r 中数据集的最大值和最小值【英文标题】:Maximum and minimum value of a dataset in r 【发布时间】:2013-06-05 21:34:15 【问题描述】:您好,我是 r 新手,我必须在下面解决这个问题
将每个组(因子水平)内的最大值和最小值与它们的值进行比较 各自的组手段。你的一个之间最大的绝对差异是什么 值及其组是什么意思?假设获得这样一个值的机会是多少 数据呈正态分布,并以相应的组均值为中心 标准差为 1?
数据集和框架由
生成 fact<-rep(c("E","F","G","H"),each=12)
variable2=rnorm(48,10)*(rep(rpois(4,.2),each=12)/8+1)
ds<-data.frame(fact,variable2)
任何帮助将不胜感激
这是我尝试过的
library(“plyr”)
ddply(ds,~fact,summarise,maximum=max(variable2),min=min(variable2),mean=mean(variable2))
【问题讨论】:
除了你试过的,还有什么不行? 也许是个愚蠢的问题,但你跑过library("plyr")
了吗?
Steph 感谢运行代码尝试使用库(“ggplot2”)。是否有用于回答下一个问题的语法?您的一个值与其组均值之间最大的绝对差异是多少?假设数据呈正态分布并以各自的组均值为中心,标准差为 1,那么获得这样一个值的机会是多少?
@Diin 太好了,您现在应该可以发布更新以消除 ddply 错误消息。计算出平均值后,您应该能够将汇总表与原始数据集连接/合并,以获得值和平均值之间的差异。
@StephLocke 你能帮我解决第二个问题吗?
【参考方案1】:
你快到了。 dnorm
函数将在这里为您提供帮助
res <- ddply(ds, ~fact ,
summarise ,
maxi = max(variable2) - mean(variable2),
mini = min(variable2) - mean(variable2) )
res$probmax <- dnorm( res$maxi )
res$probmin <- dnorm( res$mini )
# fact maxi mini probmax probmin
#1 E 1.7736537 -1.622157 0.08275571 0.1070311818
#2 F 1.7733593 -2.269254 0.08279894 0.0303883803
#3 G 2.6621257 -3.708242 0.01153470 0.0004120085
#4 H 0.8461922 -1.749625 0.27888407 0.0863339664
【讨论】:
以上是关于r 中数据集的最大值和最小值的主要内容,如果未能解决你的问题,请参考以下文章
R语言使用caret包的predict函数对模型在测试集上的表现进行推理和预测predict函数对测试数据集进行数据预处理(和训练集的初始方式保持一致):缺失值填充数值变量最小最大缩放独热编码
R语言使用Which.max和Which.min函数定位数据对象中的第一个最大值或最小值实战:使用which.max函数查找第一个最大值的索引使用which.min函数查找第一个最小值的索引