R数据结构之数据框创建

Posted 吼吼大王

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R数据结构之数据框创建相关的知识,希望对你有一定的参考价值。

mydata <- data.frame(col1, col2, col3,...)

其中,列向量col1, col2, col3,...可为任意类型(如字符型、数值型或逻辑性),每一列的名称可由函数names指定。

但 pay attention : 各个列向量的长度必须保持一致。

# 代码1
> age <- c(25,34,28,52)
> diabetes <- c("Type1", "Type2", "Type1", "Type1")
> status <- c("Poor","Improved","Excellent","Poor")
> patientdata <- data.frame(patientID, age, diabetes, status)
> patientdata
        patientID age diabetes status
1           1         25   Type      Poor
2           2         34   Type2    Improved
3           3         28   Type1    Excellent
4           4         52   Type1    Poor

每一列数据的模式必须唯一,不过可以将多个模式的不同列放到一起组成一个数据框。

此外,对列名称的修改可在形成数据框之时,如:patientdata <- data.frame(ID=patientID, Age=age, Diabetes=diabetes,Status= status)

or ,你可以通过names()函数修改,如:names(patientdata) <- c("ID","Age","Diabetes","Status")

2. 选取数据框中的元素

选取数据框中元素的方式有若干种,可以使用如矩阵中的下标记号,亦可直接指定列名。
# 代码2
> patientdata[1:2]
   patientID age
1     1          25
2      2         34
3      3         28
4      4         52
> patientdata[c("diabetes","status")]
     diabetes  status
1     Type1    Poor
2     Type2    Improved
3     Type1    Excellent
4     Type1    Poor
> patientdata\$age
[1] 25 34 28 52
记号‘\$‘是数据框中特有的表示方法,它可以选取数据框中的某个特定变量。

例如,生成变量diabetes和变量status的列联表:
> table(patientdata\$diabetes, patientdata\$status)

          Excellent Improved Poor
Type1       1          0            2
Type2       0          1            0

好了,剩余内容后续补充~

以上是关于R数据结构之数据框创建的主要内容,如果未能解决你的问题,请参考以下文章

R语言之创建数据集

从零开始系列-R语言基础学习笔记之二 数据结构

《R语言实战》之 创建数据集(第二章,各种数据结构)

从零开始学习R语言——数据结构之“数据框(Data Frames)”

R语言基础-向量|矩阵|数组|数据框|数据IO|实用函数

根据 R 中的列名创建一个新数据框,其中包含来自另一个数据框的列