【R去重】保留第一个重复/去所有的重复

Posted 2023-03-30

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了【R去重】保留第一个重复/去所有的重复相关的知识，希望对你有一定的参考价值。

参考技术A R语言第二章数据处理③删除重复数据
果子学生信

1.保留第一个重复: A,A,B,C --->A,B,C
2.去掉所有重复:A,A,B,C --->B,C
一般情况函数默认都是保留第一个重复。

比如：

在R中识别和删除重复数据：

主要运用 dplyr::n()

do包中的duplicate()命令和duplicated()命令的主要区别是前者包含了所有重复项，后者不包含重复的第一项。
duplicate()命令在开发版的do包中，CRAN上的do包并不包含这一命令。
安装方法是devtools:install_github("yikeshu0611/do")

去掉所有重复最简洁函数： df %>% group_by(a) %>% filter(n()==1)

如何去掉一个数组的重复元素：数组去重

可以使用双重循环，逐一对比元素，如有重复，则删除的方法去重。
其思路为
1、依次遍历循环中的每一个元素。
2、对于任意一个元素，依次与之前的元素进行对比，如果有重复则删除。
3、删除操作可以采用将后续元素逐个前移，达到覆盖当前元素的效果。
在此基础上可以进行一点优化，即，不需要每次删除元素均前移所有元素，而是把需要保留的元素放到"应该"放的位置即可，这样可以提高效率。
以整型数组为例，参考代码如下：

1234567891011121314
int remove_repeat(int *a, int l)//对起始地址为a，长度为l的数组进行去重，新的长度以返回值形式返回。 int i,j, r=0; //i,j为循环下标，r为去重后元素总数，初始值为0 for(i = 0; i < l; i ++) for(j = 0; j < r; j ++)//检查是否重复 if(a[j] == a[i]) break; if(j == r) //没有重复元素 a[r++] = a[i]; //将当前元素放置与去重后数组的尾部，并增加去重后的总数。 return r; //返回新的长度。参考技术A function removeDop(arr)//数组去重
return [...new Set(arr)];

以上是关于【R去重】保留第一个重复/去所有的重复的主要内容，如果未能解决你的问题，请参考以下文章

【R去重】 保留第一个重复/去所有的重复

如何去掉一个数组的重复元素：数组去重

【R去重】保留第一个重复/去所有的重复