限制R中数据框中的列类

Posted

技术标签:

【中文标题】限制R中数据框中的列类【英文标题】:constraining on classes of column in data frame in R 【发布时间】:2015-03-24 07:47:58 【问题描述】:

所以,我正在尝试编写一个以数据框作为输入的函数,以检查数据框的列是否仅包含整数、字符(非因子)和数字向量。在这种情况下,我想返回值TRUE。如果它包含其他内容,我想返回FALSE

例如:

df1 <- data.frame( a = 1:4, b = c("x","y", "z","w"), c = 8:11, stringsAsFactors = FALSE)
df2 <- data.frame(a = 2:5,  b = c("m", "n", "o", "p"),c = 11:14, stringsAsFactors = TRUE)

在这种情况下,函数应该返回 TRUE 和输入 df1,因为它具有整数和字符类型列。但是对于df2,我想返回FALSE,因为它包含因子列b

有人可以帮忙吗?

【问题讨论】:

试试f1 &lt;- function(dat) !any(sapply(dat, is.factor)); f1(df1); f1(df2) 您是说希望所有列是数字还是字符?那么其他类呢,比如“日期”? 是的,所有列应该是数字、字符或整数。 @akrun,感谢您的回复。但是您的解决方案仅检查它是否不包含在因子列中。但是这里我们也需要检查其他类型。 【参考方案1】:

由于整数也是数字,所以可以使用条件

is.numeric(x) | is.character(x)

这是一个函数:

numOrChar <- function(df) 
    f <- function(x) is.numeric(x) | is.character(x)
    all(vapply(df, f, logical(1L)))


numOrChar(df1)
# [1] TRUE
numOrChar(df2)
# [1] FALSE

【讨论】:

以上是关于限制R中数据框中的列类的主要内容,如果未能解决你的问题,请参考以下文章