Java通过Lambda表达式根据指定字段去除重复数据(集合去重)

Posted 剑桥大表哥

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Java通过Lambda表达式根据指定字段去除重复数据(集合去重)相关的知识,希望对你有一定的参考价值。

这里博主给大家封装好了一个工具类,里面有两个方法。

  • 方法一:可以根据指定字段去除重复数据。
  • 方法二:可以获取到重复的数据。

大家在使用过程中直接拷贝下方代码在要去重的类中调用即可。

package com.jzmy.specialist.entity.util;
import java.util.Map;
import java.util.concurrent.ConcurrentHashMap;
import java.util.function.Function;
import java.util.function.Predicate;

/**
 * 操作去重工具类
 * @author mengzhichao
 * @create 2022-11-02-15:15
 */
public class DeduplicationUtil 
    /**
     * 自定义函数去重(采用 Predicate函数式判断,采用 Function获取比较key)
     * 内部维护一个 ConcurrentHashMap,并采用 putIfAbsent特性实现
     *
     * @param keyExtractor
     * @param <T>
     * @return
     */
    public static <T> Predicate<T> distinctByKey(Function<? super T, ?> keyExtractor) 
        Map<Object,Boolean> seen = new ConcurrentHashMap<>();
        return t -> seen.putIfAbsent(keyExtractor.apply(t), Boolean.TRUE) == null;
    

    /**
     * 只获取重复的数据
     *
     * @param keyExtractor
     * @param <T>
     * @return
     */
    public static <T> Predicate<T> distinctNotByKey(Function<? super T, ?> keyExtractor) 
        Map<Object,Boolean> seen = new ConcurrentHashMap<>();
        return t -> seen.putIfAbsent(keyExtractor.apply(t), Boolean.TRUE) != null;
    


导入这个工具类后怎么使用呢?我们接着往下看。

方法一根据指定字段去重

package com.jzmy.specialist.entity.util;

import java.util.ArrayList;
import java.util.List;
import java.util.stream.Collectors;

/**
 * @author mengzhichao
 * @create 2022-12-02-10:46
 */
public class Test 
    public static class Student

        private String id;

        private String name;

        public String getId() 
            return id;
        

        public void setId(String id) 
            this.id = id;
        

        public String getName() 
            return name;
        

        public void setName(String name) 
            this.name = name;
        
    

    public static void main(String[] args) 

        List<Student> list =new ArrayList<>();

        Student student =new Student();
        student.setId("1");
        student.setName("张三");
        list.add(student);

        Student student2 =new Student();
        student2.setId("1");
        student2.setName("张三");
        list.add(student2);

        Student student3 =new Student();
        student3.setId("1");
        student3.setName("李四");
        list.add(student3);

        Student student4 =new Student();
        student4.setId("2");
        student4.setName("王五");
        list.add(student4);

        System.out.println("未去重前list有几条数据:"+list.size());


        List<Student> rstList = list.stream().filter(DeduplicationUtil.distinctByKey(Student::getId)).collect(Collectors.toList());

        System.out.println("未去重前list有几条数据:"+rstList.size());
    

List rstList = list.stream().filter(DeduplicationUtil.distinctByKey(Student::getId)).collect(Collectors.toList());

  • 这段代码的意思是通过stream的filter方法进行过滤,过滤Id不相同的数据并通过collect方法收集为一个新的集合。

代码运行结果

方法二获取重复数据

package com.jzmy.specialist.entity.util;

import java.util.ArrayList;
import java.util.List;
import java.util.stream.Collectors;

/**
 * @author mengzhichao
 * @create 2022-12-02-10:46
 */
public class Test 
    public static class Student

        private String id;

        private String name;

        public String getId() 
            return id;
        

        public void setId(String id) 
            this.id = id;
        

        public String getName() 
            return name;
        

        public void setName(String name) 
            this.name = name;
        
    

    public static void main(String[] args) 

        List<Student> list =new ArrayList<>();

        Student student =new Student();
        student.setId("1");
        student.setName("张三");
        list.add(student);

        Student student2 =new Student();
        student2.setId("1");
        student2.setName("张三");
        list.add(student2);

        Student student3 =new Student();
        student3.setId("1");
        student3.setName("李四");
        list.add(student3);

        Student student4 =new Student();
        student4.setId("2");
        student4.setName("王五");
        list.add(student4);

        System.out.println("集合中的全部数据");
        for (int i=0;i<list.size();i++)
            System.out.println(list.get(i).getId());
            System.out.println(list.get(i).getName());
        

        List<Student> rstList = list.stream().filter(DeduplicationUtil.distinctNotByKey(Student::getId)).collect(Collectors.toList());

        System.out.println("集合中的重复数据");
        for (int i=0;i<rstList.size();i++)
            System.out.println(rstList.get(i).getId());
            System.out.println(rstList.get(i).getName());
        
    

List rstList = list.stream().filter(DeduplicationUtil.distinctNotByKey(Student::getId)).collect(Collectors.toList());

  • 这个和上面那个方法原理一样的只是换了一个调用方法而已。

代码运行结果

以上是关于Java通过Lambda表达式根据指定字段去除重复数据(集合去重)的主要内容,如果未能解决你的问题,请参考以下文章

Java通过Lambda表达式根据指定字段去除重复数据(集合去重)

20145207《Java程序设计》第7周学习总结

mysql 根据两个字段值查询时如何去除重复数据

sql查询中如何去除某个字段重复的数据

Mysql去除中文字符&判断字段是不是有中文字符

JDK8:Lambda根据 单个字段多个字段,分组求和