集合框架

Posted 2020-09-06 一路晨光

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了集合框架相关的知识，希望对你有一定的参考价值。

集合框架

1、Collection框架

Collection接口

|-----List接口（有序可重复）

|------ArrayList类（底层采用变长数组实现，查找速度快，不安全，效率高）

|------Vector类（底层采用变长数组实现，安全，效率低）

|------LinkedList类（底层采用双向链表实现，插入删除速度快）

|-----Set接口（无序不可重复，有序是指存储顺序和插入的顺序一样）

|----HashSet类

（无序不可重复，用hash表实现，底层是HashMap，屏蔽了value的Map）

|------LinkedHashSet类

（有序不可重复，底层维护了hash表和双向链表）

|----SortedSet接口（数据排序的，不可重复）

|------TreeSet类

（对插入的数据排序，不可重复，底层采用二叉排序树实现，底层就是一个TreeMap）

Map接口（无序，key不可重复，value可重复）

|-----HashMap类（用hash表实现，无序，线程不安全，效率高，key值允许为null）

|-----HashTable类（用hash表实现，无序，线程安全，效率低，key值不允许为null）

|-----SortedMap接口（排好序的Map）

|------TreeMap类

（排好序的，对插入的key值进行排序，底层采用排序二叉树实现）

2、Collection接口定义的方法

Collection接口是所有集合的顶级父接口。

Collection接口中定义的方法是每个集合都具备的！

（1）boolean add(Object o):向集合中添加新元素，返回值:true添加元素成功。

（2）boolean remove(Object o);将给定元素从集合中删除，返回值:true删除成功

（3）int size():返回当前集合的元素总数

（4）boolean isEmpty();判断集合中是否含有元素。

（5）boolean contains(Object obj);判断集合是否包含给定的元素

（6）void clear();清空集合;

（7）boolean addAll(Collection c);将给定集合中的所有元素添加到当前集合

（8）boolean removeAll(Collection c);删除当前集合中与给定集合相同的元素

（9）Iterator iterator();返回当前集合的迭代器

（10）Object[] toArray();用于将集合转换为数组

T[ ] toArray( T[ ] a)

Arrays.asList()将数组转成list类型

3、List集合

List集合：有序且可重复集

两个常用的实现类：ArrayList和LinkedList

用法完全一样，只是因为实现方式不同，各有千秋

ArrayList使用数组实现，所以更适合读取存储的数据

LinkedList使用链表实现，所以更适合插入和删除元素。

List接口中定义的独有方法

（1）Object get(int index):获取给定索引出的元素

（2）Object set(int index,Object obj);将给定的元素存入集合指定位置

（3）add(int index ,Object obj);向集合指定位置插入元素

（4）remove(int index);删除指定位置的元素

（5）int indexOf(Object obj)；查询指定元素在集合中的位置

在集合中查询给定元素第一次出现的位置。

这里也是使用给定元素与集合元素进行equals的比较方式

（6）int lastIndexOf(Object obj)；

在集合中查询给定元素最后一次出现的位置。

（7）List<E> subList(int from,int to)

获取当前集合的部分内容。取子集

凡是表示范围的都是包含开始，不包含结束。

4、案例

（1）List list = new ArrayList();

ArrayList内部使用对象数组形式实现。

在创建ArrayList对象时，ArrayList会初始化一个数组，

当要存放的元素数量大于数组时，ArrayList会自动扩容数组长度。

list.add("一");

list.add("二");

System.out.println(list);

ArrayList重写了Object的toString方法

返回的字符串格式为： [元素1.toString(),元素2.toString(),....]

会顺序调用集合中每个元素的toString方法，并拼接在一起。

list.clear();

System.out.println(list==null);//false

System.out.println(list.isEmpty());//true

注意：判断null和isEmpty的区别

null指的是集合对象是否存在。

isEmpty()指的是集合对象是存在的，只不过没有元素。

（2）List list=new ArrayList();

Point p=new Point(1,2);

list.add(p);

list.add(new Point(3,4));

Point point=new Point(1,2);

System.out.println(list.contains(point));

list.remove(point);

System.out.println(list);

注意：元素的equals方法对集合的很多操作都有影响！

判断集合是否包含给定的元素时，集合会将这个元素与集合中的元素分别进

行equals比较，若有返回值为true的，则认为集合包含给定的元素。

remove方法是将给定的元素与集合中每个元素进行equals比较，删除第一

个比较结果为true的元素。

（3） List list1 = new ArrayList();

List list2 = new ArrayList();

List list3 = new ArrayList();

list1.add("一");

list1.add("二");

list1.add("三");

System.out.println(list1);

list2.add("四");

list2.add("五");

list3.add("一");

list3.add("二");

list1.addAll(list2);

System.out.println(list1);

list1.removeAll(list3);

System.out.println(list1);

list1.retainAll(list2);

取交集：只保留list1中和list2中相同的元素

System.out.println(list1);

以上方法比较元素相同都是使用equals方法比较的。

（4） List list = new ArrayList();

list.add("one");

list.add("two");

list.add("three");

for(int i = 0;i<list.size();i++){

String str = (String)list.get(i);

System.out.println(str);

}

set方法用于替换集合中指定位置上的元素，set方法的返回值为被替换的元素

set方法指定的索引位置不能大于数组的元素数量，否则会出现下标越界异常

Object old = list.set(2, "二");

System.out.println(list);

System.out.println("被替换的元素:"+old);

（5）String[] array = (String[])list.toArray(new String[0]);

将集合转换为数组

注意:要确保集合中存放的元素类型是一致的！

且要转换的目标数组类型要与元素类型一致。

toArray()方法用于将集合转换为数组

toArray方法是Collection定义的方法。所有集合都具备

想转换什么类型的数组，toArray方法参数就传什么类型数组的实例

我们给定的数组实例不需要给长度，因为不会使用，

toArray方法只是借鉴了我们传入参数数组的类型。

（6） List<Integer> list=new ArrayList<Integer>();

for(int i=0;i<10;i++){

list.add(i);

}

System.out.println(list);

List<Integer> subList=list.subList(0,4);

System.out.println(subList);

修改子集会影响原集合中的元素

for(int i=0;i<subList.size();i++){

subList.set(i, subList.get(i)*10);

}

System.out.println(subList);

System.out.println(list);

5、迭代器Iterator接口

Collection中提供了一个方法

Iterator iterator()：该方法用于返回当前集合的迭代器

迭代器是用于遍历集合的。

由于每种集合的内部实现不同，迭代器遍历集合元素的方式也不尽相同，所以我们不需

要记住每一种迭代器的名字。我们就统一把他们看成迭代器去使用就可以了。

Iterator接口

定义了三个方法

boolean hashNext():：询问迭代器迭代的集合是否还有元素。

Object next():：next方法获取集合中下一个元素与get方法一样，

存放的时候以Object存的，取的时候也是以Object返回的，所以要造型。

void remove():删除刚刚迭代出来的元素。

使用迭代器的流程

问拿删。可以不删除元素。但一定要注意，问一次拿一次！

List迭代

List list = new ArrayList();

list.add("one");

list.add("#");

list.add("two");

list.add("#");

list.add("three");

list.add("#");

java.util.Iterator：迭代器是专门为while循环设计的

Iterator it = list.iterator();

while(it.hasNext()){

String element = (String)it.next();

if("#".equals(element)){

//将上面通过next方法获取的元素从集合中删除

it.remove();

迭代器在迭代过程中，不能通过使用集合定义的删除方法去删除集合元

素，一定要使用迭代器的删除方法，否则迭代过程中会产生异常！

//list.remove(element);

}

System.out.println(element);

}

如下迭代：对于链表性能低下(每次找元素都是从第一个开始往后找)

没有迭代器性能好！迭代器是集合的最优遍历算法

for(int i=0;i<eggs.size();i++){

System.out.println(eggs.get(i)) ;

}

6、泛型

java1.5之后支持的一个新特性

可以在我们使用某个类的时候，动态的给该类的属性或方法的参数，返回值指定类型。

public class ArrayList<E>{

public boolean add(E e){...}

public E get(int index){...}

}

List<String> list = new ArrayList<String>();

list.add("123");

String s =list.get(0);

当支持泛型的类我们在使用的时候不指定泛型类型时，那么泛型类型默认就是Object

集合对泛型的支持

集合中的泛型指定的是存放的元素是什么类型的。

List<String> list = new ArrayList<String>();

list.add("123");

list.add("456");

list.add("789");

//list.add(123);//参数类型不匹配！

for(int i =0;i<list.size();i++){

get方法获取元素时直接是泛型指定的类型，无需再进行造型了

String element = list.get(i);

System.out.println(element);

}

迭代器也支持泛型

但要注意！迭代器指定的泛型类型一定要和遍历的集合的泛型类型一致！

Iterator<String> it = list.iterator();

while(it.hasNext()){

使用迭代器获取元素时也不再需要造型

String element = it.next();

System.out.println(element);

}

自定义泛型

泛型的语法

在定义类的时候，在类名之后用<>定义泛型

泛型命名可以是字母与数字的组合，数字不能是第一个字符

若指定多个泛型，中间用","分开

class Point<X,Y>{

private X x;

private Y y;

public Point(X x, Y y) {

this.x = x;

this.y = y;

}

public X getX() {

return x;

}

public void setX(X x) {

this.x = x;

}

public Y getY() {

return y;

}

public void setY(Y y) {

this.y = y;

}

泛型是一个动态的过程，是用于告知jvm运行时该类的属性类型。

所以，不指定泛型时，默认就是Object

public static void dosome(Point p){

p.setX("12");

p.setY("12.2");

System.out.println(p);

}

public static void main(String[] args) {

Point<Integer, Double> point1=

new Point<Integer, Double>(1,1.2);

int x=point1.getX();

double y=point1.getY();

Point.dosome(point1);

}

JAVA泛型的? extends和? super的比较

（1）? extends叫做向上造型.

ArrayList<? extends BaseCls> list1 = new ArrayList<BaseCls>();

意味着这个list1里面放的都是BaseClse的子类,保证你可以通过list.get(index)

得到的类都是BaseCls或者BaseCls的子类.

BaseCls cls = list1.get(0);//合法的

list1.add(new BaseCls());或者list1.add(new CldCls());都是不合法的.

这里面是不能通过add函数放东西进去的,那这样有什么用呢.

一般来讲,定义成? extends BaseCls的参数通常只能用来从里面取数据.

如下downbound方法可以接受? extends BaseCls类型的list

public void downbound(List<? extends BaseCls> list) {

for(BaseCls cls:list){

cls.func();

}

ArrayList<BaseCls> list1 = new ArrayList<BaseCls>();

ArrayList<CldCls> list2 = new ArrayList<CldCls>();

downbound(list1);和downbound(list2);都是合法的。

（2）? super BaseCls叫做向下造型.

ArrayList<? super BaseCls> list2 = new ArrayList<BaseCls>();

意味着这个list2里面只能放BaseClse或者它的子类.

list2.add(new BaseCls());或者list2.add(new CldCls());都是合法的.

list2.get(index)返回的是Object类型,因为不知道是那个具体类.

限制了放进去的对象的类型

public void upperbound(List<? super BaseCls> list) {

list.add(new BaseCls()

list.add(new CldCls());

}

7、增强for循环

java1.5后的有一个新特性

增强for循环又叫新循环

新循环的作用是遍历集合和数组的。不能用新循环代替传统循环。

for(TYPE ele : array){

....

}

TYPE：集合或数组的元素类型

ele：元素的引用变量

array：要遍历的集合或数组的实例

新循环的循环次数有遍历的集合或数组的长度决定。

每次循环时，会将集合或数组中的元素依次赋值给ele，然后进入循环体。

使用新循环注意两点

（1）新循环是在编译时动态将新循环转化为迭代器方式遍历

（2）因为新循环使用迭代器方式遍历，所以在遍历集合时，不能通过集合删除元素。

java1.5后出现的特性有：泛型 增强for循环 包装类的自动拆装箱

8、队列Queue接口（extends Collection）

队列是一种非常常用的数据结构，存取数据本着先进先出原则。

java中提供了Queue接口来描述队列。

常用的实现类为LinkedList。

boolean offer(E e)：向队列末尾追加元素，追加成功返回true

E poll()：从队首获取元素。注意:获取后，队首元素就从队列中删除了。

如果队列为空时，返回null。

E peek()：获取队首元素，但该元素不会从队列中删除。

9、栈结构Deque接口

Deque接口

栈也可以保存一组数据，在存取方式上也有要求，本着先进后出原则。

LinkedList也是其一个实现类

push(E e):向栈顶压入新元素

E pop():返回栈顶元素，并从栈中删除。

当栈中没有元素时，调用该方法会引发异常

E peek():获取栈顶元素，但不删除

遍历栈结构：

（1）Iterator<String> it=deque.iterator();

while(it.hasNext()){

String str=it.next();

System.out.println(str);

}

（2）while(deque.peek() != null){

String element = deque.pop();

System.out.println(element);

}

10、Collection与Collections的区别？

Collection 抽象的集合概念，实现它的有List和Set。

Collections 集合静态工具类, 包含集合的工具方法，如

sort、reverse、shuffle、binarySearch等。

11、Comparable接口和Comparator接口

集合的排序

若要进行排序，就要确定元素的大小。对象与对象间的大小关系如何确定？

（1）java提供了一个接口Comparable

Comparable接口定义了一个抽象方法compareTo()

compareTo()：用于定义对象间的比较规则。

当我们定义的一个类若实现了该接口，那么就说明这个类的实例是可比较的。

String类实现了Complarable接口，String对象时可以比较的。、

定义Point类可以比较

public class Point implements Comparable<Point>{

private int x;

private int y;

public Point(int x,int y){

this.x = x;

this.y = y;

}

返回的int值不关心具体的值是多少，只关心取值范围

当返回值大于0 表示当前对象比参数对象大（当前对象往右移）

当返回值小于0 表示当前对象比参数对象小（当前对象往左移）

当返回值等于0 表示当前对象和参数对象相等

public int compareTo(Point o) {

int r = this.x * this.x + this.y * this.y;

int r1 = o.x * o.x + o.y * o.y;

return r-r1;//升序

}

public static void main(String[] args) {

List<Point> list=new ArrayList<Point>();

list.add(new Point(3,2));

list.add(new Point(5,2));

list.add(new Point(1,6));

注意：使用Collections的sort()方法，集合里的元素必须是可比较的

Collections.sort(list);

System.out.println(list);

}

（2）当类中的比较规则不能满足我们对排序的要求时，可以使用Collections的重载sort

方法。给定一个比较规则，按照我们的规则比较后进行自然排序。

Collections.sort(Collection c,Comparator cc)

Comparator接口：用于定义一种比较规则。

通常Comparator不需要定义额外的子类实现，都是使用匿名类的方式创建实例。

List<String> list = new ArrayList<String>();

list.add("mary");

list.add("Killer");

list.add("able");

字符串实现了Comparable接口，所以字符串本身是具备可比较的

Collections.sort(list);

System.out.println(list);

需求:按照字符串的长短来排序

字符串的比较规则不能满足这个排序需求时，

我们可以额外的定义比较规则来满足该排序的需求

Comparator<String> comparator =

new Comparator<String>(){

public int compare(String o1, String o2) {

return o1.length() - o2.length();

}

};

Collections.sort(list, comparator);

System.out.println(list);

12、Set集合

Set集有别于List集最大的特点的是不存放相同的元素。Set集合不能通过索引的形式获取元素。

常见的实现类

HashSet：使用散列算法实现的Set集合

TreeSet：使用二叉树算法实现的Set集合（底层就是TreeMap，key是存放的数据，value为null。底层都是调用TreeMap的方法来实现的）

遍历Set集合的元素只有一种方式，迭代器。Set集合不支持索引，也不具备List集合的get方法。

（1）遍历Set集合中的元素

Set<String> set = new HashSet<String>();

无序是指元素存放的顺序与取出来的顺序不一致

但是在元素不修改的前提下，如论以什么顺序存放在Set集合中的顺序都是一定的。

set.add("two");

set.add("three");

set.add("one");

//迭代器

Iterator<String> it = set.iterator();

while(it.hasNext()){

String str = it.next();

System.out.println(str);

}

增强for循环同样可以遍历Set集合，对于编译器而言，增强for循环在编译后会转换为iterator，所以可以用增强循环遍历

for(String str : set){

System.out.println(str);

}

（2）随机生成20个不重复的数字：

Set<Integer> set = new HashSet<Integer>();

Random r = new Random();

while(size<20){

set.add(r.nextInt(100));

}

hashcode方法与HashSet之间的关系

HashSet在存放某个元素时，会先获取该元素的hashcode值，然后进行一系列的运算，之后确定将元素存放在什么位置。这里通过的算法确定位置，算法就是“散列算法”。

可以看出，一个元素要想存入HashSet需要依赖hashcode()方法的返回值。

hashcode()方法是Object定义的方法，所有类都具有该方法。我们应该妥善的重写hashcode()方法。

javaAPI中对重写该方法有说明:

若我们重写了equals()方法，就应该重写hashcode()方法。

hashcode()方法应与equals()方法返回一致。

即:当两个对象equals()方法返回true时，hashcode的返回值应该相同。

在对象没有修改的前提下，多次调用hashcode方法返回的数字不应该发生改变。

当两个对象的equals方法返回false时,hashcode值不是必须不同的。

根据HashSet实现原理可以看出，若不同对象的hashcode值都相同，那么使用HashSet的效率会大大的降低。

13、Map接口

（1）Map是一种以键值(key-value)对的形式存放数据的结构。

Map的存储要求是，key不能重复。

散列表中元素的顺序是散列数组中元素的顺序，与散列算法的计算结果有关，与添加顺序无关称为“无序集合”。无序！=随机

（2）最常用实现类

HashMap:以散列算法实现的Map

TreeMap:以二叉树算法实现的Map

TreeMap是添加元素时会按照某种排序规则来寻找存放的位置，

如何排序：先看有没有传入比较器TreeMap tm = new TreeMap(new MyComparator());

有的话按照给的比较器来排序，没有的话根据TreeMap中的key自身的比较规则来排序（Comparable），这时key值如果是不可比较的，则报错。

（3）HashSet实际上使用HashMap实现的。

当我们将一个元素add到HashSet中时，HashSet将这个元素作为key存入了HashMap，value值设置为null。因为HashMap对key的要求是不重复且存放顺序与获取顺序不同，正好满足Set集合的特征。

HashMap要求Key对象在hashCode值不发生改变的情况下，只能保存一次。

（4）HashMap的性能

HsahMap散列表算法，面向查找优化的算法，查找性能优异（无论多少数据，查找次数少于3次）

Capacity 散列表容量:HashMap的散列数组的大小（能存储key-value数量的最大值）。

Initial capacity 初始容量：创建HashMap实例时，默认创建的散列数组的大小。默认为16。可以改变。但一般不会这样做。

Size 大小： HashMap中存储的数据总数。存储（key-value）的数量。

散列桶：散列值相同的元素集合(散列桶长度越小，性能越好)

size/容量<=加载因子(75%)

load factor 加载因子：加载因子的值默认为0.75。这是一个比值，size/capacity。当size与capacity的比值大于0.75时，hashmap会对散列数组进行扩容，并重新分配内部元素位置(重新散列rehash)。rehash是需要消耗一定的性能的。应减少rehash的次数来提高性能。

性能优化：

影响性能：散列表容量和加载因子

加载因子较小时候散列查找性能会提高，同时也浪费了散列桶空间容量。

0.75是性能和空间相对平衡结果。在创建散列表时候指定合理容量，减少rehash提高性能。

（5）Map的存取元素的方法

V put(K k,V v)：将key-value对存入Map。若Key值已经在Map中存在的话，那么就将Value值替换。返回值则是被替换的Value，若该Key不存在，则将Value存入，返回值为null。

V get(Object k)：根据给定的key值获取对应的Value。若当前给定的key在Map中不存在，则返回null。

boolean containsKey(Object key)：查看当前Map中是否包含给定的key，包含返回true。

boolean containsValue(Object value)：查看当前Map中是否包含给定的Value，包含返回true。

（6）遍历Map

遍历Map有三种方式:

a、遍历Map中所有的key

public Set keySet()：调用keySet()方法会返回一个Set集合的实例，其中保存

的元素为Map中的所有key。

b、遍历Map中所有的键值对(Entry)

public Set entrySet()：调用entrySet()方法会返回一个Set集合的实例，其中保存的元素为Map中的每一组键值对，每个键值对用一个Entry实例保存。

c、遍历Map中所有的value(不常用)

案例：

（1）统计str字符串中每组数字出现的次数

思路:

先将字符串按照","拆分，将每组数字作为key,将出现次数作为value存入map。这样每当统计一组数字时，我们只需要看这组数字作为key是否在map中存在，不存在则是第一次统计。若存在，则将出现次数累加即可。

String str = "123,456,778,908,123,454,678,234,908,123";

String[] array = str.split(",");

Map<String,Integer> map = new HashMap<String,Integer>();

for(String sub : array){

if(map.containsKey(sub)){

map.put(sub, map.get(sub) + 1);

}else{

map.put(sub, 1);

}

System.out.println(map);

（2）遍历Map中的所有Key

Map<String, Integer> map=new HashMap<String, Integer>();

map.put("A", 1);

map.put("C", 3);

map.put("B", 2);

Set<String> set=map.keySet();

for(String key:set){

Integer value=map.get(key);

System.out.println(key+","+value);

}

（3）遍历Map的键值对

Map中有一个内部类Entry，其每一个实例描述一组键值对。当我们调用put方法存放数据时，Map会创建一个Entry实例，并将key,value存入该对象后保存到Map中。所以，散列数组中，每一项的LinkedList中保存的都是Entry。

Map<String, Integer> map=new HashMap<String, Integer>();

map.put("A", 1);

map.put("C", 3);

map.put("B", 2);

Set<Entry<String, Integer>> set=map.entrySet();

for(Entry<String, Integer> entry:set){

String key=entry.getKey();

Integer value=entry.getValue();

System.out.println(key+":"+value);

}

（4）遍历Map中的所有Value

Map<String, Integer> map=new HashMap<String, Integer>();

map.put("A", 1);

map.put("C", 3);

map.put("B", 2);

为什么返回Collection而不返回Set?

因为Set集合不能存放重复元素，而Map中value是可以重复的，若返回为Set集合，可能会丢失信息。

Collection<Integer> set=map.values();

for(Integer integer:set){

System.out.println(integer);

}

以上是关于集合框架的主要内容，如果未能解决你的问题，请参考以下文章