R语言数组数据框因子

Posted 2021-04-18 大学生资料阁

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了R语言数组数据框因子相关的知识，希望对你有一定的参考价值。

可以在两个以上的维度存储数据的R数据对象
存储相同类型的元素
维度向量：表示数组中各维的长度的向量

创建数组

可以通过array函数方便地创建数组
array(data = NA,dim = length(data),dimnames = NULL)

数组是矩阵的一个自然推广。与矩阵一样，数组中的数据也只能拥有一种模式
从数组中选取元素的方式与矩阵相同。不同的是数组的维度更高，下标也更为复杂

程序示例
R语言数组数据框因子

数据框是仅次于向量的最重要的数据对象类型，是R语言中最常处理的数据结构。由于数据有多种数据类型，所以无法将此数据集放入一个矩阵。在这种情况下，数据框是最佳选择

数据框索引和矩阵类似，主要有：

R语言数组数据框因子

数据框可以通过edit函数和fix函数手动修改

rbind函数和cbind函数分别增加新的样本数据和新属性变量
（需要注意的是，rbind函数的自变量的宽度（列数）应该与原数据框的宽度相等，而cbind函数的自变量的高度（行数）应该与原数据框的高度相等，否则程序将会报错）

names函数可以读取数据框的列名以进行修改操作

R语言数组数据框因子

因子型变量可以取得的所有值，被称为因子水平（levels）

在R中，使用因子来表示名义变量或有序变量，其中factor()函数是一种定义因子的方法。它是将一个向量转换成因子，其使用格式为

factor(x = character(),levels,labels = levels,exclude = NA,ordered = is.ordered(x))

名称	取值及意义
x	数据向量，也就是被转换成因子的向量
levels	可选向量，表示因子水平，当此参数缺省时，由x元素中的不同值来确定
labels	可选向量，用来指定各水平的名称，缺省时，取levels的值
exclude	从x中剔除的水平值，默认值为NA
ordered	逻辑变量，取值为TRUE时，表示因子水平是有次序的（按编码次序）；否则（FALSE）是无次序的

diabetes　＜－　factor（diabetes）

status　＜－　factor（status，ordered＝TRUE）

levels（status）

factor()以一个整数向量的形式存储类别值

整数的范围是[1.k]

同时一个由字符串组成的

内部变量将映射到这些整数上

以上是关于R语言数组数据框因子的主要内容，如果未能解决你的问题，请参考以下文章