第4章--基本数据管理

Posted cyoutetsu

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了第4章--基本数据管理相关的知识,希望对你有一定的参考价值。

4.1 创建新变量

在典型的项目研究中,你可能需要创建新的变量或者对现有的变量进行变换。这可以通过以下语句来完成:

变量名←表达式

以上语句中的表达式部分可以分成包含多种运算符合函数。

 

4.2 变量的重编码

重编码涉及根据同一个变量和/或其他变量的现有值创建新值的过程。其中涉及到:

  • 将一个连续型变量修改为一组类别值;
  • 将误编码的值替换为正确值;
  • 基于一组分数线创建一个表示及格/不及格的变量

函数within(),它允许你修改数据框。

 

4.3 变量的重命名

可以使用一个fix()的函数来调用一个交互式的编辑器,单击变量名然后在弹出的对话框中将其重命名。

或者,

reshape包中有一个rename(dataframe, c(oldname="newname",))可以用来修改变量名。

 

4.4 缺失值

在R中,缺失值以符号NA表示。不可能出现的值用NaN表示。

函数is.na()允许你检测缺失值是否存在,如果某个元素是缺失值,相对应的位置将被改成TRUE,不是缺失值的位置则为FALSE。

 

4.5 日期值

日期值通常以字符串的形式输入到R中,然后转换为以数值形式存储的日期变量。函数as.Date()用于执行这种转换。

有两个函数对于处理时间戳数据特别实用。

Sys.Date()可以返回当天的日期;

data()返回当前的日期和时间。

以上是关于第4章--基本数据管理的主要内容,如果未能解决你的问题,请参考以下文章

R语言实战-云图

数据挖掘导论 第4章 分类:基本概念决策树与模型评估

大数据技术之Hive

第1章:Activity

第4章变量作用域和内存问题

《Elasticsearch 源码解析与优化实战》第 6 章:数据模型