第4章--基本数据管理
Posted cyoutetsu
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了第4章--基本数据管理相关的知识,希望对你有一定的参考价值。
4.1 创建新变量
在典型的项目研究中,你可能需要创建新的变量或者对现有的变量进行变换。这可以通过以下语句来完成:
变量名←表达式
以上语句中的表达式部分可以分成包含多种运算符合函数。
4.2 变量的重编码
重编码涉及根据同一个变量和/或其他变量的现有值创建新值的过程。其中涉及到:
- 将一个连续型变量修改为一组类别值;
- 将误编码的值替换为正确值;
- 基于一组分数线创建一个表示及格/不及格的变量
函数within(),它允许你修改数据框。
4.3 变量的重命名
可以使用一个fix()的函数来调用一个交互式的编辑器,单击变量名然后在弹出的对话框中将其重命名。
或者,
reshape包中有一个rename(dataframe, c(oldname="newname",))可以用来修改变量名。
4.4 缺失值
在R中,缺失值以符号NA表示。不可能出现的值用NaN表示。
函数is.na()允许你检测缺失值是否存在,如果某个元素是缺失值,相对应的位置将被改成TRUE,不是缺失值的位置则为FALSE。
4.5 日期值
日期值通常以字符串的形式输入到R中,然后转换为以数值形式存储的日期变量。函数as.Date()用于执行这种转换。
有两个函数对于处理时间戳数据特别实用。
Sys.Date()可以返回当天的日期;
data()返回当前的日期和时间。
以上是关于第4章--基本数据管理的主要内容,如果未能解决你的问题,请参考以下文章