使用R语言将不同长度的向量合并为数据框
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用R语言将不同长度的向量合并为数据框相关的知识,希望对你有一定的参考价值。
参考技术A 语句很简单,只有一句d1 <- do.call(cbind, lapply(lapply(d, unlist), length<- , max(lengths(d))))
lapply(x,fun),lapply接收两个值,x为向量或列表,fun是方法,这个函数的意思是将fun方法作用到x的每个元素,返回一个与x相同长度的列表
unlist函数接收一个列表,unlist将其简化为一个包含列表中所有原子成分的向量
外面嵌套的那层lapply函数,是将每个向量元素的长度设定为最长的那个长度,缺失值用NA补齐
cbind是按列合并向量,如果两列数量不一样会自动重复短的那列
do.call函数与lapply函数功能类似,但有一点不一样
lapply()为列表中的每个元素应用一个给定的函数,所以会有几个函数调用。
do.call()将给定的函数作为一个整体应用于列表,所以只有一个函数调用。
详细差别见 http://www.dovov.com/rlapplydo-call.html
R语言实战.3
分别是向量形式输入数据
显示对象的结构
显示对象的统计概要
首先,以向量的形式输入数据➊。然后,将diabetes和status分别指定为一个普通因子和一个有序型因子。最后,将数据合并为一个数据框。函数str(object)可提供R中某个对象(本例中为数据框)的信息➋。它清楚地显示diabetes是一个因子,而status是一个有序型因子,以及此数据框在内部是如何进行编码的。注意,函数summary()会区别对待各个变量➌。它显示了连续型变量age的最小值、最大值、均值和各四分位数,并显示了类别型变量diabetes和status(各水平)的频数值。
列表(list)是R的数据类型中最为复杂的一种。一般来说,列表就是一些对象(或成分,component)的有序集合。列表允许你整合若干(可能无关的)对象到单个对象名下。例如,某个列表中可能是若干向量、矩阵、数据框,甚至其他列表的组合。可以使用函数list()创建列表:
mylist <- list(object1, object2, ...)
其中的对象可以是目前为止讲到的任何结构。你还可以为列表中的对象命名:
mylist <- list(name1=object1, name2=object2, ...)
结果
提取结果
本例创建了一个列表,其中有四个成分:一个字符串、一个数值型向量、一个矩阵以及一个字符型向量。可以组合任意多的对象,并将它们保存为一个列表。
你也可以通过在双重方括号中指明代表某个成分的数字或名称来访问列表中的元素。此例中,mylist[[2]]和mylist[["ages"]]均指那个含有四个元素的向量。对于命名成分,mylist$ages也可以正常运行。由于两个原因,列表成为了R中的重要数据结构。首先,列表允许以一种简单的方式组织和重新调用不相干的信息。其次,许多R函数的运行结果都是以列表的形式返回的。需要取出其中哪些成分由分析人员决定。
R中一些头麻的地方
对象名称中的句点(.)没有特殊意义,但美元符号($)却有着和其他语言中的句点类似的含义,即指定一个数据框或列表中的某些部分。例如,A$x是指数据框A中的变量x。
❏ R不提供多行注释或块注释功能。你必须以#作为多行注释每行的开始。出于调试目的,你也可以把想让解释器忽略的代码放到语句if(FALSE){... }中。将FALSE改为TRUE即允许这块代码执行。
❏ 将一个值赋给某个向量、矩阵、数组或列表中一个不存在的元素时,R将自动扩展这个数据结构以容纳新值。举例来说,考虑以下代码:
> x <- c(8, 6, 4)
> x[7] <-10
> x
[1] 8 6 4 NA NA NA 10
通过赋值,向量x由三个元素扩展到了七个元素。x <- x[1:3]会重新将其缩减回三个元素。
❏ R中没有标量。标量以单元素向量的形式出现。
❏ R中的下标不从0开始,而从1开始。在上述向量中,x[1]的值为8。
❏ 变量无法被声明。它们在首次被赋值时生成。
要了解更多,参阅John Cook的优秀博文“R programming for those coming from other languages”(www.johndcook.com/Rlanguagefor_programmers.html)。
那些正在寻找编码风格指南的程序员不妨看看“Google's R Style Guide”[插图](http://google-styleguide.googlecode.com/svn/trunk/google-r-style.html)。
这些是面向开发者的R语言,很多反常规的设计
也许输入数据最简单的方式就是使用键盘了。有两种常见的方式:用R内置的文本编辑器和直接在代码中嵌入数据。我们首先考虑文本编辑器。
R中的函数edit()会自动调用一个允许手动输入数据的文本编辑器。具体步骤如下:
(1) 创建一个空数据框(或矩阵),其中变量名和变量的模式需与理想中的最终数据集一致;
(2) 针对这个数据对象调用文本编辑器,输入你的数据,并将结果保存回此数据对象中。
在下例中,你将创建一个名为mydata的数据框,它含有三个变量:age(数值型)、gender(字符型)和weight(数值型)。然后你将调用文本编辑器,键入数据,最后保存结果。
类似于age=numeric(0)的赋值语句将创建一个指定模式但不含实际数据的变量。注意,编辑的结果需要赋值回对象本身。函数edit()事实上是在对象的一个副本上进行操作的。如果你不将其赋值到一个目标,你的所有修改将会全部丢失!
在Windows上调用函数edit()的结果如图我已经自主添加了一些数据。单击列的标题,你就可以用编辑器修改变量名和变量类型(数值型、字符型)。你还可以通过单击未使用列的标题来添加新的变量。编辑器关闭后,结果会保存到之前赋值的对象中(本例中为mydata)。再次调用mydata <- edit(mydata),就能够编辑已经输入的数据并添加新的数据。语句mydata <- edit(mydata)的一种简捷的等价写法是fix(mydata)。
可以少打几个字母
就是好像不太稳定,经常莫名其妙的崩溃
这个是help("file")注意写有双引号
以上是关于使用R语言将不同长度的向量合并为数据框的主要内容,如果未能解决你的问题,请参考以下文章