R语言数据表匹配和拼接-merge函数

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R语言数据表匹配和拼接-merge函数相关的知识,希望对你有一定的参考价值。

参考技术A merge(x, y, by = intersect(names(x), names(y)), by.x = by, by.y = by, all = FALSE, all.x = all, all.y = all, sort = TRUE, suffixes = c(".x",".y"), incomparables = NULL, ...)

x,y:用于合并的两个数据框

by,by.x,by.y:用于连接两个数据集的列,intersect(a,b)值向量a,b的交集,names(x)指提取数据集x的列名 by = intersect(names(x), names(y)) 是获取数据集x,y的列名后,提取其公共列名,作为两个数据集的连接列, 当有多个公共列时,需用下标指出公共列,如names(x)[1],指定x数据集的第1列作为公共列 也可以直接写为 by = ‘公共列名’ ,前提是两个数据集中都有该列名,并且大小写完全一致,R语言区分大小写

all,all.x,all.y:指定x和y的行是否应该全在输出文件.

sort:by指定的列是否要排序.

suffixes:指定除by外相同列名的后缀.

incomparables:指定by中哪些单元不进行合并.

merge函数有4种匹配拼接模式,分别为inner,left,right和outer模式。 其中inner为默认的匹配模式。all=T代表全连接,all.x=T代表左联结;all.y=T代表右连接

inner 模式匹配,只显示两个数据集公共列中均有的行

outer 模式,将两张表的数据汇总,表中原来没有的数据置为空

left 匹配模式

right 匹配模式

R语言merge函数使用数据行名称内连接dataframe数据使用数据行名称连接dataframe数据设置by=0或者row.names,all=TRUE使用rownames函数为数据行命名

R语言merge函数使用数据行名称内连接dataframe数据(merge data frames by row names)、merge函数使用数据行名称连接dataframe数据设置by=0或者row.names,all=TRUE、仿真数据、使用rownames函数为数据行命名

目录

以上是关于R语言数据表匹配和拼接-merge函数的主要内容,如果未能解决你的问题,请参考以下文章

R中使用merge()函数合并数据

r语言 merge函数by.x啥意思

R的merge怎么出现很多行重复

R的merge怎么出现很多行重复

R语言merge函数连接多个dataframe数据集迭代内连接dataframe数据( iteratively merge data frames in R)默认merge函数通过公共列名合并数据

以基因名字合并两个数据集(R语言,merge函数)