R语言实战之创建数据集
Posted BrightWise
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R语言实战之创建数据集相关的知识,希望对你有一定的参考价值。
数据结构
向量:
向量是用于存储数值型、字符型或逻辑型数据的一维数组。
可通过函数c()可用来创建向量
实例操作:
矩阵:
矩阵是一个二位数组,只是每个元素都拥有相同的模式(数值型、字符型或逻辑型)
可通过函数matrix()创建矩阵
实例操作:
数组:
数组(array)与矩阵类似,但是维度可以大于2
数组可通过array函数创建
实例操作:
数据框
由于不同的列可以包含不同模式(数值型、字符型等)的数据,数据框的概念较矩阵来说更为一般。数据框是R中最常处理的数据结构
数据框可通过函数data.frame()创建
实例操作:
因子
类别(名义型)变量和有序类别(有序型)在R中称为因子。因子在R中非常重要,因为它决定了数据的分析方式以及如何进行视觉呈现。名义型变量是没有顺序之分的类别变量。有序型变量表示一种顺序关系,而非数量关系。连续型变量可以呈现为某个范围内的任意值。
函数factor()以一个整数向量的形式存储类别值,整数的取值范围是[1...k],同时一个由字符串(原始值)组成的内部向量将映射到这些整数上。
实例操作:
列表
列表就是一些对象的有序集合,某个列表中可能是若干向量、矩阵、数据框,甚至其他列表的组合。
可以使用函数list()创建列表:
数据的输入
R可以从键盘、文本文件、excel、数据库以及其他各种软件中导入数据,在这里只是用excel的导入作为例子,来了解一下大致的操作。
导入Excel数据
因为使用到了xlsx包,所以要先安装一下。导入的excel是格力电器的财报数据。这里可以看到excel的数据被转换成了R中的数据框。
一些简单操作
可以查看格力电器的收入和净利润,或者进一步看最近七年的这两项数据。
以上是关于R语言实战之创建数据集的主要内容,如果未能解决你的问题,请参考以下文章
R语言构建ElasticNet回归模型实战:基于mtcars数据集