详解 Set接口

Posted codderyouzg

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了详解 Set接口相关的知识,希望对你有一定的参考价值。

(请关注 本人“集合”总集篇博文——《详解 Collection接口》

在Collection接口的子接口中,最重要的,也是最常见的两个—— List接口Set接口
那么,为什么有了 List接口这么方便的接口,还要讲解Set接口呢?
在本人博文——《详解 List接口》中就讲过:
List接口中可以存储相同的元素,在特定情况下,我们要进行处理的数据不能存在相同项(举个十分常见的例子:我国人民的身份证号),那么,我们就不能再用List进行存储了,为了防止重复数据的录入。
所以,就有了本人这篇博文的主题——Set接口
那么,话不多说了,开始我们这篇博文的讲解吧:

Set接口:

定义:

一个不包含重复元素的 collection。即 最多包含一个 null 元素。
(对其所包含的元素有所限制,例如:不允许存储null)


方法:

  • boolean add(E e)
    如果 set 中尚未存在指定的元素,则添加此元素(可选操作)。
  • boolean addAll(Collection<? extends E> c)
    如果 set 中没有指定 collection 中的所有元素,则将其添加到此 set 中(可选操作)。
  • void clear()
    移除此 set 中的所有元素(可选操作)。
  • boolean contains(Object o)
    如果 set 包含指定的元素,则返回 true
  • boolean containsAll(Collection<?> c)
    如果此 set 包含指定 collection 的所有元素,则返回 true
  • boolean equals(Object o)
    比较指定对象与此 set 的相等性
  • int hashCode()
    返回 set 的哈希码值
  • boolean isEmpty()
    如果 set 不包含元素,则返回 true
  • Iterator iterator()
    返回在此 set 中的元素上进行迭代的迭代器
  • boolean remove(Object o)
    如果 set 中存在指定的元素,则将其移除(可选操作)。
  • boolean removeAll(Collection<?> c)
    移除 set 中那些包含在指定 collection 中的元素(可选操作)。
  • boolean retainAll(Collection<?> c)
    保留 set 中那些包含在指定 collection 中的元素(可选操作)。
  • int size()
    返回 set 中的元素数(其容量)
  • Object[] toArray()
    返回一个包含 set 中所有元素数组
  • < T > T[] toArray(T[] a)
    返回一个包含此 set 中所有元素数组
    返回数组的运行时类型指定数组的类型

我们可以看到,Set接口 与 本人上一篇博文中讲解的 List接口的方法是大致相同的。
同样的,Set接口也有三个很常用的实现类——HashSet、LinkedHashSet 和 TreeSet。
那么,现在本人来对这三个类进行一下讲解吧:

HashSet:

特点:

  • HashSet 底层数据结构是哈希表.
  • HashSet 是 线程不安全的 (即: 效率高的)
  • 集合元素可以是 null
  • 元素(由底层数据结构决定):
    无序(存储顺序不一致),
    且唯一(存储的元素不重复)

在这里,可能会有同学有疑问了——哈希表是什么呢?
那么,本人在这里稍作解释:

哈希表(HashMap):

  1. 是一个元素为链表数组(JDK1.7之前)
    数组 + 链表 + 红黑树 的结构 (JDK1.8 之后)
  2. 综合了数组和链表的优点

(至于“哈希”, 也就是“散列”的数据结构
在本篇博文中,本人不对这个算法进行讲解,仅讲解用了这个算法后
如需详解,请关注本人之后的博文——《HashMap 源码解析》)

但是,本人要强调的一点是:
我们用HashSet去存储新数据时,是按照如下步骤的:

  1. 调用该对象的hashCode() 方法来得到该对象的 hashCode 值
  2. 根据 hashCode 值决定该对象在 HashSet 中的存储位置
  3. 若存在 hashCode 值相等 且 在该 HashSet中已经存在的 元素时,
  4. 调用 这两个对象的 equals() 方法
    若equals()的返回值 相等,则判定这两个元素相等,不再录入新数据
    若equals()的返回值 不想等,则在 旧元素位置所在数组的位置链接新元素(当链接的元素足够时,还要用到红黑树的数据结构)
    现在,本人来通过一个例子来证明下上面的说法:

首先是只存储了 姓名 和 年龄 的People类:

package aboutSet;

public class People {
    private String name;
    private int age;

    public People() {
    }

    public People(String name, int age) {
        this.name = name;
        this.age = age;
    }

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }

    public int getAge() {
        return age;
    }

    public void setAge(int age) {
        this.age = age;
    }

    @Override
    public String toString() {
        return "People{" +
                "name='" + name + ''' +
                ", age=" + age +
                '}';
    }

    @Override
    public boolean equals(Object o) {
        return true;
    }

    @Override
    public int hashCode() {
        return 0;
    }
}

本人刻意让hashCode()和equals() 返回一个定值
按照上面的说法,我们在测试类中所建立的HashSet容器,只能录入第一个人的信息

那么,现在本人来给出一个测试类,来验证下上面的说法是否正确:

package aboutSet;

import java.util.HashSet;

public class Test {

    public static void main(String[] args) {
        People s1 = new People("张无忌", 19);
        People s2 = new People("王祖贤", 23);
        People s3 = new People("张学友", 20);
        People s4 = new People("周润发", 20);
        
        HashSet<People> Peoples = new HashSet<>();
        Peoples.add(s1);
        Peoples.add(s2);
        Peoples.add(s3);
        Peoples.add(s4);
        
      for (People people : Peoples) {
            System.out.println(people);
        }
    }

}

那么,现在本人来展示下运行结果:
技术图片
可以清晰地看到,本人的说法毫无问题!

现在,本人将hashCode()和equals() 方法恰当地重写:

@Override
    public boolean equals(Object o) {
        if (this == o) return true;
        if (o == null || getClass() != o.getClass()) return false;
        People student = (People) o;
        return age == student.age &&
                Objects.equals(name, student.name);
    }

    @Override
    public int hashCode() {
        return Objects.hash(name, age);
    }

并将测试类中给HashSet录入数据的代码改为如下:

        People s1 = new People("张无忌", 19);
        People s2 = new People("王祖贤", 23);
        People s3 = new People("张无忌", 23);
        People s4 = new People("张学友", 20);
        People s5 = new People("张无忌", 20);
        
        HashSet<People> Peoples = new HashSet<>();
        Peoples.add(s1);
        Peoples.add(s2);
        Peoples.add(s3);
        Peoples.add(s4);
        Peoples.add(s5);

现在,我们再来看一下运行结果:
技术图片
我们可以看到,由于我们重写了hashCode()和equals()方法,导致两者的返回值,
除了第一个和第五个意外,都不一样。
所以最终的输出结果只有四条,且都不一样,这就说明了:
HashSet存储数据的判断标准由hashCode()和equals()这两个方法决定

那么,现在,本人再来给出一个例子:

package aboutSet;

import java.util.HashSet;

public class Test {

    public static void main(String[] args) {
        Integer s1 = new Integer(19);
        Integer s2 = new Integer(23);
        Integer s3 = new Integer(3);
        Integer s4 = new Integer(0);
        Integer s5 = new Integer(19);
        
        HashSet<Integer> Integers = new HashSet<>();
        Integers.add(s1);
        Integers.add(s2);
        Integers.add(s3);
        Integers.add(s4);
        Integers.add(s5);
        
      for (Integer Integer : Integers) {
            System.out.println(Integer);
        }
    }

}

可以看到,本人并没有重写hashCode()和equals()方法,而且我们的Integer 类型的五个对象,全都是通过new得到的,但是,让我们来看看输出结果:
技术图片
可以看到,地址值不同的 Integer类型的五个对象,有一个却因为值相同没有被录入
这又是为什么呢?难道本人上面的说法错了吗?
答曰:非也!这是因为:有些工具类(包括Integer类型在内),都重写了hashCode()和equals()方法,不需要我们去重写。

那么,在看完上面的结论和例子之后,本人再来提出一条结论:
我们重写hashCode()方法,是为了减少“哈希碰撞次数”(相关知识点将在本人《HashMap 源码解析》博文中进行讲解),在这里我们可以认为是 调用equals()方法的次数


那么,有关HashSet的基本知识点就讲解完毕了,下面本人来对本篇博文的第二个知识点——LinkedHashSet做一下简介:

LinkedHashSet:

特点:

  • LinkedHashSet底层数据结构是 链表哈希表.
  • LinkedHashSet 是 线程不安全的 (即: 效率高的)
  • 集合元素可以是 null
  • 元素(由底层数据结构决定):
    有序(链表结构保证),
    且唯一(哈希表结构保证)

至于这个类,本人觉得没什么好多说的,除了有序外,其他特征几乎和HashSet一模一样。
现在,本人还是给出一个例子,来验证下上面的说法:

本人现在对上面的代码中的测试类修改如下:

package aboutSet;

import java.util.LinkedHashSet;

public class Test {

    public static void main(String[] args) {
        Integer s1 = new Integer(19);
        Integer s2 = new Integer(23);
        Integer s3 = new Integer(3);
        Integer s4 = new Integer(0);
        Integer s5 = new Integer(19);
        
        LinkedHashSet<Integer> Integers = new LinkedHashSet();
        Integers.add(s1);
        Integers.add(s2);
        Integers.add(s3);
        Integers.add(s4);
        Integers.add(s5);
        
      for (Integer Integer : Integers) {
            System.out.println(Integer);
        }
    }

}

那么,现在我们来看一下运行结果:
技术图片
可以看到,上面的讲解没有问题。


那么,就开始这篇博文的最后一个知识点——TreeSet吧:

TreeSet:

特点:

  • 元素唯一(二叉树存储结构 及 compareTo()方法 保证)
  • 并且可以对元素进行排序 :
  1. 自然排序
  2. 使用比较器排序

那么,现在,本人就来对这两种排序方法进行一下讲解:

首先是自然排序

自然排序:

条件

  1. 表示这个元素的类 必须实现Comparable接口 (否则无法进行自然排序)
  2. 重写Comparable接口 中的compareTo()方法,根据此方法返回的正、负、0来决定元素的排列顺序:
    若返回0:则不再录入新的元素;
    若返回-1:则将新的元素放在正在比较的元素的左边;
    若返回1:则将新的元素放在正在比较的元素的右边
  3. TreeSet对象采用空参构造

举个例子:
现给出如下几个数:
20、18、23、22、17、24、19、18、24
那么, 排列顺序就由下图所示:
技术图片
而当我们读取的时候,会按照本人在《数据结构与算法》专栏中的《二叉树的遍历 详解及实现》所讲的中根序(又称“中序”)一样。

最终的输出结果会是:17、18、19、20、22、23、24

那么,本人还是先对前一篇博文的测试类做下改动,来验证一下上面的预测:

package aboutSet;

import java.util.TreeSet;

public class Test {

    public static void main(String[] args) {
        Integer s1 = new Integer(20);
        Integer s2 = new Integer(18);
        Integer s3 = new Integer(23);
        Integer s4 = new Integer(22);
        Integer s5 = new Integer(17);
        Integer s6 = new Integer(24);
        Integer s7 = new Integer(19);
        Integer s8 = new Integer(18);
        Integer s9 = new Integer(24);
        
        TreeSet<Integer> Integers = new TreeSet();
        Integers.add(s1);
        Integers.add(s2);
        Integers.add(s3);
        Integers.add(s4);
        Integers.add(s5);
        Integers.add(s6);
        Integers.add(s7);
        Integers.add(s8);
        Integers.add(s9);
        
      for (Integer Integer : Integers) {
            System.out.println(Integer);
        }
    }

}

那么,让我们来看一下运行结果吧:
技术图片
可以看到,本人的预测十分准确!

那么,可能就有同学有疑问了:
为什么没有达到那两个条件就可以自然排序呢?
答曰:没错!Integer这个类内部实现了Comparable接口,并且重写了compareTo()方法。
本人现在来展示一下Integer的相关源码:
技术图片
技术图片
由此可见,本人的讲解没有错误!

那么,现在本人来展示下自己该如何使用自然排序:
首先本人给出一个TreeSet所存的元素的类:

package aboutSet;

import java.util.Objects;

public class People implements Comparable<People>{
    private String name;
    private int age;

    public People() {
    }

    public People(String name, int age) {
        this.name = name;
        this.age = age;
    }

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }

    public int getAge() {
        return age;
    }

    public void setAge(int age) {
        this.age = age;
    }

    @Override
    public String toString() {
        return "Student{" +
                "name='" + name + ''' +
                ", age=" + age +
                '}';
    }

    @Override
    public int compareTo(People people) {   
        //假设根据学生的年龄大小来排序
        int num = this.age - people.age;
        //但是年龄一样并不严谨,我们还要根据姓名来比较
        int num2 = num==0 ? this.name.compareTo(people.name) : num;
        
        return num2;
    }


}

现在,本人给出一个测试类:

package aboutSet;

import java.util.TreeSet;

public class Test {

    public static void main(String[] args) {
        TreeSet<People> treeSet = new TreeSet<>();

        treeSet.add(new People("张星彩", 23));
        treeSet.add(new People("关银屏", 23));
        treeSet.add(new People("王富贵", 23));
        treeSet.add(new People("姬无力", 20));
        treeSet.add(new People("奥瑞利安索尔", 30));
        treeSet.add(new People("jo太郎", 23));

        for (People People : treeSet) {
            System.out.println(People);
        }
        
    }
}

技术图片

可以看到,一切如本人在代码中的解释所料!

那么,接下来,本人来展示下 使用比较器排序

使用比较器排序:

条件

  • 采用有参构造,且在创建TreeSet对象时,需要通过参数传入一个Comparetor 比较器

现在,本人来展示下如何 使用比较器排序:

第一种手段——构造一个比较器类:

首先是存储元素信息的类

package aboutSet;

import java.util.Objects;

public class People {
    private String name;
    private int age;

    public People() {
    }

    public People(String name, int age) {
        this.name = name;
        this.age = age;
    }

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }

    public int getAge() {
        return age;
    }

    public void setAge(int age) {
        this.age = age;
    }

    @Override
    public String toString() {
        return "Student{" +
                "name='" + name + ''' +
                ", age=" + age +
                '}';
    }

}

那么,现在本人来给出一个"按照元素姓名长度进行比较"比较器:

package aboutSet;

import java.util.Comparator;

public class TestComparator implements Comparator<People>{

    public TestComparator() {
    }
    
    @Override
    public int compare(People people1, People people2) {
        //按照年龄大小排序
        int num = people1.getAge() - people2.getAge();
        int num2=num==0?people1.getName().compareTo(people2.getName()):num;

        return num2;
    }
    
}

现在,本人来给出一个测试类:

package aboutSet;

import java.util.TreeSet;

public class Test {

    public static void main(String[] args) {
        TreeSet<People> treeSet = new TreeSet<>(new TestComparator());

        treeSet.add(new People("张星彩", 23));
        treeSet.add(new People("关凤", 23));
        treeSet.add(new People("王权富贵", 23));
        treeSet.add(new People("姬无力", 20));
        treeSet.add(new People("奥瑞利安索尔", 30));
        treeSet.add(new People("空条jo太郎", 23));

        for (People People : treeSet) {
            System.out.println(People);
        }   
    }
}

那么,让我们来看一下运行结果:
技术图片

第二种手段——通过 匿名内部类 传递
People类不做改变,本人仅改变测试类:

package aboutSet;

import java.util.Comparator;
import java.util.TreeSet;

public class Test {

    public static void main(String[] args) {
        TreeSet<People> treeSet = new TreeSet<>(new Comparator<People>() {

            @Override
            public int compare(People people1, People people2) {
                //按照年龄大小排序
                int num = people1.getAge() - people2.getAge();
                int num2=num==0?people1.getName().compareTo(people2.getName()):num;


                return num2;
            }
        });

        treeSet.add(new People("张星彩", 23));
        treeSet.add(new People("关凤", 23));
        treeSet.add(new People("王权富贵", 23));
        treeSet.add(new People("姬无力", 20));
        treeSet.add(new People("奥瑞利安索尔", 30));
        treeSet.add(new People("空条jo太郎", 23));

        for (People People : treeSet) {
            System.out.println(People);
        }
        
    }
}

让我们来看一下运行结果:
技术图片
可以看到,结果依旧正确。

在这里,本人来对这两种 比较器排序 的应用场景来做一下说明:

一般地:
若是 只用一次该比较器,则使用匿名内部类传递
若是 反复多次使用该比较器,则通过一个比较器类传递

(Collection链接:https:////www.cnblogs.com/codderYouzg/p/12416566.html
(集合总集篇链接:https://www.cnblogs.com/codderYouzg/p/12416560.html

以上是关于详解 Set接口的主要内容,如果未能解决你的问题,请参考以下文章

Java集合Set接口详解——含源码分析

Java Collection接口的子接口之Set接口的详解

Java集合中List,Set以及Map等集合体系详解

java中的List详解以及代码示例

Java中的集合(List,Set,Map)(知识点详解)(看完这篇就够了)

Java中List,Set和Map详解及其区别