R语言factor最简单的理解

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R语言factor最简单的理解相关的知识,希望对你有一定的参考价值。

参考技术A 最近正在学习R语言,碰到了因子factor,自己很不理解,网上找了很多的资料,可是感觉都说的很难,自己不是很理解,所以自己决定写一篇博客来帮助和自己一样有困惑的小伙伴。

首先,因子是离散的,它不是连续的,它只是一个标签。举个例子:

下面我们主要介绍一个关于因子的关键函数factor()及他的一些参数!

这里主要说三个参数
x,我们主要传入的是一个向量,就像上面的例子一样。

为了研究第二、三个参数我们做如下test:

注意到,我们的元素是有重复的,细心的你,发现Levels: 1 2 3保存的是去重的元素,相当于python里面的集合,为什么会这样,或者说这样有什么好处,最大的好处就是节约存储空间,还有就是当数据很多且有很多重复的时候,你可以很直观的看到他真实的数据!

注意,我前面说了,factor的levels只是看不重复的的值,所以这些下该明白了吧。因为V里面不重复的就3个。
然后就会用我们实际需要的levels来一个一个替换,在实践中也是有这种需求的。

labels也可以实现,类比levels即可。传入的依然是c()向量。

R语言中的Factor到底是什么?

R语言中的Factor到底是什么?

  

因子(factors)是用于对数据进行分类(categorize)并将其存储为不同水平或者级别(levels)的数据对象。它们既可以存储字符串,也可以存储整数。Factors的唯一值是有限的。像“男”、“女”和“真”、“假”等,它们在统计建模的数据分析中很有用。

因子(factors)是通过将向量作为输入,并使用factor()函数创建的。

因子(factors)本质上就是我们常在机器学习中说的标称型数据(categorical variable)类型。

# 首先创建了一个字符型的数组(向量)

# 接着使用factor函数将向量处理为因子(factor)类型;

# Create a vector as input.
data <- c("East","West","East","North","North","East","West","West","West","East","North")

print(data)
print(is.fa

以上是关于R语言factor最简单的理解的主要内容,如果未能解决你的问题,请参考以下文章

制作具有 2 个因子的频率选项卡的最简单的 R 函数是啥?

R语言type.convert函数函数将当前向量从原来的类(class)转换为最合适的新类(character to integer内容是数值)(chr to factor内容包含字符串)

最简单的R语言绘图,教你10分钟搞定入门绘图

最简单语言理解 webpack 的用法

最简单语言理解Array扩展的新方法,map,reduce,filter,forEach

R语言里面的因子