【R去重】 保留第一个重复/去所有的重复

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了【R去重】 保留第一个重复/去所有的重复相关的知识,希望对你有一定的参考价值。

参考技术A R语言第二章数据处理③删除重复数据
果子学生信

1.保留第一个重复: A,A,B,C --->A,B,C
2.去掉所有重复:A,A,B,C --->B,C
一般情况函数默认都是保留第一个重复。

比如:

在R中识别和删除重复数据:

主要运用 dplyr::n()

do包中的duplicate()命令和duplicated()命令的主要区别是前者包含了所有重复项,后者不包含重复的第一项。
duplicate()命令在开发版的do包中,CRAN上的do包并不包含这一命令。
安装方法是devtools:install_github("yikeshu0611/do")

去掉所有重复最简洁函数: df %>% group_by(a) %>% filter(n()==1)

如何去掉一个数组的重复元素:数组去重

可以使用双重循环,逐一对比元素,如有重复,则删除的方法去重。
其思路为
1、依次遍历循环中的每一个元素。
2、对于任意一个元素,依次与之前的元素进行对比,如果有重复则删除。
3、删除操作可以采用将后续元素逐个前移,达到覆盖当前元素的效果。
在此基础上可以进行一点优化,即,不需要每次删除元素均前移所有元素,而是把需要保留的元素放到"应该"放的位置即可,这样可以提高效率。
以整型数组为例,参考代码如下:

1234567891011121314
int remove_repeat(int *a, int l)//对起始地址为a,长度为l的数组进行去重,新的长度以返回值形式返回。 int i,j, r=0; //i,j为循环下标,r为去重后元素总数,初始值为0 for(i = 0; i < l; i ++) for(j = 0; j < r; j ++)//检查是否重复 if(a[j] == a[i]) break; if(j == r) //没有重复元素 a[r++] = a[i]; //将当前元素放置与去重后数组的尾部,并增加去重后的总数。 return r; //返回新的长度。
参考技术A function removeDop(arr)//数组去重
return [...new Set(arr)];

以上是关于【R去重】 保留第一个重复/去所有的重复的主要内容,如果未能解决你的问题,请参考以下文章

pandas去重

链表去重

中国石油大学天梯赛真题模拟第六场

整数去重

整数去重

升级版去重 -- 去重且不保留重复元素