我有一个子集,我试图从特定行中提取值,以便在“R”中使用分位数

Posted

技术标签:

【中文标题】我有一个子集,我试图从特定行中提取值,以便在“R”中使用分位数【英文标题】:I have a subset and I am trying to extract values from a specific row in order to use quantiles in "R" 【发布时间】:2022-01-08 10:17:50 【问题描述】:

子集有许多不同行的值,但出于我的目的,我只使用一个

当前代码

male <- subset(dropped, SEXP == 2)
female <- subset(dropped, SEXP == 1)
incomeMale <- subset(male, TOTINCP > 0)
#a vector called percentIncome of all the values in the row TOTINCP from incomeMale

quantile(percentIncome, 0.05,0.10,0.95,0.90)

我想要一个包含 TOTINCP 中所有值的向量,以便我可以使用 quantiles 函数来获取底部 5%、10% 和顶部 5%、10% 的百分比。 我尝试使用 nrows(),但它不包含incomeMale 的子集,所以它只会给我 TOTINCP 中的所有值。

【问题讨论】:

如果您包含一个简单的reproducible example,其中包含可用于测试和验证可能解决方案的示例输入和所需输出,则更容易为您提供帮助。 【参考方案1】:

如果没有可重复的示例,很难准确理解您要查找的内容,但这里概述了如何使用 iris 数据集执行类似操作:

#Using the iris data set, limit to one species
subset(iris, Species == "virginica")

#Get a vector of the Sepal Width for one species
subset(iris, Species == "virginica")$Sepal.Width

#Get quantiles for the Sepal Width for one species
quantile(subset(iris, Species == "virginica")$Sepal.Width, c(0.05, 0.1, 0.9, 0.95))

【讨论】:

以上是关于我有一个子集,我试图从特定行中提取值,以便在“R”中使用分位数的主要内容,如果未能解决你的问题,请参考以下文章

R中的“子集”没有按照我想要的方式进行子集[重复]

根据 R 中的文件名读取栅格子集

从 PySpark 中的选定列和行中提取值

找到一组肯定包含至少一个具有特定属性值的子集的节点

从列表中提取值以将它们分配为 R 中的新变量

按列值对 R 数据框进行子集,并将与特定值匹配的单元格更改为新值