Java中集合类的区别，请高手详解

Posted 2023-05-07

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Java中集合类的区别，请高手详解相关的知识，希望对你有一定的参考价值。

在Java中
Array \ ArrayList \ Vector \ LinkedList \ Hashmap
到底有什么样的区别？
在存储数据时有什么本质的区别？

ArrayList 实现List接口 ,随着向 ArrayList 中不断添加元素，其容量也自动增长
Vector向量不过我是不太喜欢这个类
HashMap实现Map接口--可以说内存就是一个HashMap
HashTable实现一个哈希表，该哈希表将键映射到相应的值
Set一个不包含重复元素的容器
HashMap, HashTable都是“Key-Value对”形式的
Vector和ArrayList区别
Vector和ArrayList Vector和ArrayList在使用上非常相似,都可用来表示一组数量可变的对象应用的集合,并且可以随机地访问其中的元素。
Vector的方法都是同步的(Synchronized),是线程安全的(thread-safe)，而ArrayList的方法不是，由于线程的同步必然要影响性能，因此,ArrayList的性能比Vector好。
当Vector或ArrayList中的元素超过它的初始大小时,Vector会将它的容量翻倍,而ArrayList只增加50%的大小，这样,ArrayList就有利于节约内存空间。

Hashtable和HashMap的区别
Hashtable和HashMap它们的性能方面的比较类似 Vector和ArrayList，比如Hashtable的方法是同步的,而HashMap的不是。

ArrayList和LinkedList的区别
对于处理一列数据项,Java提供了两个类ArrayList和LinkedList, ArrayList的内部实现是基于内部数组Object[], 所以从概念上讲,它更象数组，但LinkedList的内部实现是基于一组连接的记录,所以,它更象一个链表结构，所以,它们在性能上有很大的差别。
从上面的分析可知,在ArrayList的前面或中间插入数据时,你必须将其后的所有数据相应的后移,这样必然要花费较多时间，所以,当你的操作是在一列数据的后面添加数据而不是在前面或中间,并且需要随机地访问其中的元素时,使用ArrayList会提供比较好的性能
而访问链表中的某个元素时,就必须从链表的一端开始沿着连接方向一个一个元素地去查找,直到找到所需的元素为止，所以,当你的操作是在一列数据的前面或中间添加或删除数据,并且按照顺序访问其中的元素时,就应该使用LinkedList了。
如果在编程中,1，2两种情形交替出现,这时,你可以考虑使用List这样的通用接口,而不用关心具体的实现，在具体的情形下,它的性能由具体的实现来保证。
配置集合类的初始大小
在Java集合框架中的大部分类的大小是可以随着元素个数的增加而相应的增加的，我们似乎不用关心它的初始大小,但如果我们考虑类的性能问题时,就一定要考虑尽可能地设置好集合对象的初始大小,这将大大提高代码的性能。
比如,Hashtable缺省的初始大小为101,载入因子为0.75,即如果其中的元素个数超过75个,它就必须增加大小并重新组织元素，所以,如果你知道在创建一个新的Hashtable对象时就知道元素的确切数目如为110,那么,就应将其初始大小设为110/0.75=148,这样,就可以避免重新组织内存并增加大小。参考技术A Array 是普通数组，容量不可变，貌似不在集合类包里
Vector 是容量可变的数组

List Set Map 都是接口

ArrayList，LinkedList 都是 List接口的实现，和数组基本差不多，可用操作比数组多
Map 存放的是键-值对用键做索引参考技术B http://www.yesky.com/405/1752905.shtml

可以去看看，有关集合的说明参考技术C 集合类型主要有3种：set(集）、bailist(列表）和map(映射)。
1、List（有序、可重复）
List里存放的对象是有序的，同时也是可以重复的，List关注的是索引，拥有一系列和索引相关的方法，查询速度快。因为往list集合里插入或删除数据时，会伴随着后面数据的移动，所有插入删除数据速度慢。
2、Set（无序、不能重复）

Set里存放的对象是无序，不能重复的，集合中的对象不按特定的方式排序，只是简单地把对象加入集合中。

3、Map（键值对、键唯一、值不唯一）

Map集合中存储的是键值对，键不能重复，值可以重复。根据键得到值，对map集合遍历时先得到键的set集合，对set集合进行遍历，得到相应的值。

首先java中集合类主要有两大分支

本文仅分析部分原理和集合类的特点，不分析源码，旨在对java的集合类有一个整体的认识，理解各个不同类的关联和区别，让大家在不同的环境下学会选择不同的类来处理。

Java中的集合类包含的内容很多而且很重要，很多数据的存储和处理（排序，去重，筛选等）都需要通过集合类来完成。

首先java中集合类主要有两大分支：

（1）Collection （2）Map

先看它们的类图：

(1)Collection

Collection

(2)Map
Map

可以看到它们之间的关系纷繁复杂，如果不系统的学习一下，还真是不知道有什么区别，该怎么选择。由于HashSet的内部实现原理是使用了HashMap，所以我们的学习路线为先学习Map集合类，然后再来学习Collection集合类。

(1)HashMap和Hashtable ( 注意table是小写的t，搞不懂为什么要这样，老是会写错。。。)

首先来看HashMap和HashTable，这两兄弟经常被放到一起来比较，那么它们有什么不一样呢？

a.HashMap不是线程安全的；HashTable是线程安全的，其线程安全是通过Sychronize实现。

b.由于上述原因，HashMap效率高于HashTable。

c.HashMap的键可以为null，HashTable不可以。

d.多线程环境下，通常也不是用HashTable，因为效率低。HashMap配合Collections工具类使用实现线程安全。同时还有ConcurrentHashMap可以选择，该类的线程安全是通过Lock的方式实现的，所以效率高于Hashtable。

好，比较了他们的不一样后，来讲讲它们的原理。

数组，链表，哈希表。各有优劣，顺便提一下，数组连续内存空间，查找速度快，增删慢；链表充分利用了内存，存储空间是不连续的，首尾存储上下一个节点的信息，所以寻址麻烦，查找速度慢，但是增删快；哈希表呢，综合了它们两个的有点，一个哈希表，由数组和链表组成。假设一条链表有1000个节点，现在查找最后一个节点，就得从第一个遍历到最后一个；如果用哈希表，将这条链表分为10组，用一个容量为10数组来存储这10组链表的头结点（a[0] = 0 , a[1] = 100 , a[2] = 200 …）。这样寻址就快了。

HashMap实现原理就是上述原理了，当然其具体实现还有很多其他的东西。Hashtable同理，只不过做了同步处理。

Hash碰撞，不同的key根据hash算法算出的值可能一样，如果一样就是所谓的碰撞。

优化措施：

(1) HashMap的扩容代价非常大，要生成一个新的桶数组，然后要把所有元素都重新Hash落桶一次，几乎等于重新执行了一次所有元素的put。所以如果我们对Map的大小有一个范围的话，可以在构造时给定大小，一般大小设置为：(int) ((float) expectedSize / 0.75F + 1.0F)。

(2) key的设计尽量简洁。

HashMap一些功能实现：

a.按值排序

HashMap按值排序通过Collections的sort方法，在实现排序之前，我们先看看HashMap的几种遍历方式：

//Collection And Map
public static void testCM(){
//Collection
Map<Integer , String> hs = new HashMap<Integer , String>();
int i = 0;
hs.put(199, "序号:"+201);
while(i<50){
hs.put(i, "序号:"+i);
i++;
}
hs.put(-1, "序号:"+200);
hs.put(200, "序号:"+200);

//遍历方式一:for each遍历HashMap的entryset，注意这种方式在定义的时候就必须写成
//Map<Integer , String> hs，不能写成Map hs;
for(Entry<Integer , String> entry : hs.entrySet()){
System.out.println("key:"+entry.getKey()+" value:"+entry.getValue());
}
//遍历方式二：使用EntrySet的Iterator
Iterator<Map.Entry<Integer , String>> iterator = hs.entrySet().iterator();
while(iterator.hasNext()){
Entry<Integer , String> entry = iterator.next();
System.out.println("key:"+entry.getKey()+" value:"+entry.getValue());
};
//遍历方式三：for each直接使用HashMap的keyset
for(Integer key : hs.keySet()){
System.out.println("key:"+key+" value:"+hs.get(key));
};
//遍历方式四：使用keyset的Iterator
Iterator keyIterator = hs.keySet().iterator();
while(keyIterator.hasNext()){
Integer key = (Integer)keyIterator.next();
System.out.println("key:"+key+" value:"+hs.get(key));

（1）使用keyset的两种方式都会遍历两次，所以效率没有使用EntrySet高。

（2）HashMap输出是无序的，这个无序不是说每次遍历的结果顺序不一样，而是说与插入顺序不一样。

接下来我们看按值排序，注释比较详细就不赘述过程了。

//对HashMap排序
public static void sortHashMap(Map<Integer , String> hashmap){

System.out.println("排序后");

//第一步，用HashMap构造一个LinkedList
Set<Entry<Integer , String>> sets = hashmap.entrySet();
LinkedList<Entry<Integer , String>> linkedList = new LinkedList<Entry<Integer , String>>(sets);

//用Collections的sort方法排序
Collections.sort(linkedList , new www.thd178.com/ Comparator<Entry<Integer , String>>(){

@Override
public int compare(Entry<Integer , String> o1, Entry<Integer , String>www.2018yulpt.com o2) {
// TODO Auto-generated method stub
/*String object1 = (String) o1.getValue();
String object2 = (String) o2.getValue();
return object1.compareTo(object2);*/
return o1.getValue().compareTo(o2.getValue());
}

});

//第三步，将排序后的list赋值给LinkedHashMap
Map<Integer , String> map = new LinkedHashMap();
for(Entry<Integer , String> entry : linkedList){
map.put(entry.getKey(), entry.getValue());
}
for(Entry<Integer , String> entry : map.entrySet()){
System.out.println("key:"+entry.getKey()+" value:"+entry.getValue());
b.按键排序

HashMap按键排序要比按值排序方法容易实现，而且方法很多，下面一一介绍。

第一种：还是熟悉的配方还是熟悉的味道，用Collections的sort方法，只是更改一下比较规则。

第二种：TreeMap是按键排序的，默认升序，所以可以通过TreeMap来实现。

public static void sortHashMapByKey(Map hashmap){

System.out.println("按键排序后");

//第一步：先创建一个TreeMap实例，构造函数传入一个Comparator对象。
TreeMap<Integer , String> treemap = new TreeMap<Integer , String>(new Comparator<Integer>(){

@Override
public int compare(Integer o1,Integer o2) {
// TODO Auto-generated method stub
return Integer.compare(o1, o2);
}

});
//第二步：将要排序的HashMap添加到我们构造的TreeMap中。
treemap.putAll(hashmap);
for(Entry<Integer , String> entry : treemap.entrySet()){
System.out.println("key:"+entry.getKey()+" value:"+entry.getValue());
第三种：可以通过keyset取出所有的key，然后将key排序，再有序的将key-value键值对存到LinkedHashMap中，这个就不贴代码了，有兴趣的可以自己去尝试一下。

c.value去重

对于HashMap而言，它的key是不能重复的，但是它的value是可以重复的，有的时候我们要将重复的部分剔除掉。

方法一：将HashMap的key-value对调，然后赋值给一个新的HashMap，由于key的不可重复性，此时就将重复值去掉了。最后将新得到的HashMap的key-value再对调一次即可。

d.HashMap线程同步

第一种：

Map<Integer , String> hs = new HashMap<Integer , String>(www.ccyl178.com/);
hs = Collections.synchronizedMap(hs);
1
2
第二种：

ConcurrentHashMap<Integer , String> hs = new ConcurrentHashMap<Integer , String>();
1
(2)IdentifyHashMap

IdentityHashMap与HashMap基本相似，只是当两个key严格相等时，即key1==key2时，它才认为两个key是相等的。IdentityHashMap也允许使用null，但不保证键值对之间的顺序。

(3)WeakHashMap

WeakHashMap与HashMap的用法基本相同，区别在于：后者的key保留对象的强引用，即只要HashMap对象不被销毁，其对象所有key所引用的对象不会被垃圾回收，HashMap也不会自动删除这些key所对应的键值对对象。但WeakHashMap的key所引用的对象没有被其他强引用变量所引用，则这些key所引用的对象可能被回收。WeakHashMap中的每个key对象保存了实际对象的弱引用，当回收了该key所对应的实际对象后，WeakHashMap会自动删除该key所对应的键值对。

接下来是Collection接口及其子类：

(4)ArrayList , LinkedList , Vector

(1)首先，说说它们的关系和区别。ArrayList和Vector本质都是用数组实现的，而LinkList是用双链表实现的；所以，Arraylist和Vector在查找效率上比较高，增删效率比较低；LinkedList则正好相反。ArrayList是线程不安全的，Vector是线程安全的，效率肯定没有ArrayList高了。实际中一般也不怎么用Vector,可以自己做线程同步，也可以用Collections配合ArrayList实现线程同步。

(2)Tips

前面多次提到扩容的代价很高，所以如果能确定容量的大致范围就可以在创建实例的时候指定，注意，这个仅限于ArrayList和Vector哟：

ArrayList arrayList = new ArrayList(www.xyyulept.com100);
arrayList.ensureCapacity(200);
Vector vector = new Vector(100);
vector.ensureCapacity(200);
(3)其他功能实现

a.排序

List的排序的话就是使用Collections的sort方法，构造Comparator或者让List中的对象实现Comparaable都可以，这里就不贴代码了。

b.去重

第一种：用Iterator遍历，遍历出来的放到一个临时List中，放之前用contains判断一下。

第二种：利用set的不可重复性,只需三步走。

//第一步：用HashSet的特性去重
HashSet tempSet = new HashSet(arrayList);
//第二步：将arrayList清除
tempSet.clear();
//第三步：将去重后的重新赋给List
arrayList.addAll(tempSet);
(5)Stack

Stack呢，是继承自Vector的，所以用法啊，线程安全什么的跟Vector都差不多，只是有几个地方需要注意：

第一：add()和push()，stack是将最后一个element作为栈顶的，所以这两个方法对stack而言是没什么区别的，但是，它们的返回值不一样，add()返回boolean，就是添加成功了没有；push()返回的是你添加的元素。为了可读性以及将它跟栈有一丢丢联系，推荐使用push。

第二：peek()和pop()，这两个方法都能得到栈顶元素，区别是peek()只是读取，对原栈没有什么影响；pop()，从字面上就能理解，出栈，所以原栈的栈顶元素就没了。

(6)HashSet和TreeSet

Set集合类的特点就是可以去重，它们的内部实现都是基于Map的，用的是Map的key，所以知道为什么可以去重复了吧。
既然要去重，那么久需要比较，既然要比较，那么久需要了解怎么比较的，不然它将1等于2了，你怎么办？

比较是基于hascode()方法和equals()方法的，所以必要情况下需要重新这两个方法。

好了，到了总结的时候了，其实你会发现集合类虽然看起来多，但是都是很有规律的。ArrayList,LinkedList一个无序，一个有序；HashSet,TreeSet一个无序，一个有序；HashMap,LinkedHasmMap,一个无序，一个有序；Vector和HashTable，Stack是线程安全的，但是效率低；线程不安全的类都可以配合Collections得到线程安全的类。

以上是关于Java中集合类的区别，请高手详解的主要内容，如果未能解决你的问题，请参考以下文章

java中集合类中Collection接口中的List接口的常用方法熟悉

Java中集合类容器初步了解

JAVA中几种集合(List、Set和Map)的区别

java中集合类中Collection接口中的Set接口的常用方法熟悉

Java集合：整体结构

商汤科技2面复盘