java集合专题 (ArrayListHashSet等集合底层结构及扩容机制HashMap源码)
Posted ycl学java
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了java集合专题 (ArrayListHashSet等集合底层结构及扩容机制HashMap源码)相关的知识,希望对你有一定的参考价值。
一、数组与集合比较
数组:
1)长度开始时必须指定,而且一旦指定,不能更改
2)保存的必须为同一类型的元素
3)使用数组进行增加/删除元素-比较麻烦
集合:
1)可以动态保存任意多个对象,使用比较方便
2)提供了一系列方便的操作对象的方法: add、remove、set、 get等
3)使用集合添加,删除新元素-更加简洁
二、常见集合体系图
(1)常见单列集合
List: 有序可重复、支持索引、可根据索引值取数据、可以存入多个null值
Set: 无序不可重复、无索引、最多只包含一个null值
(2)常见双列集合
三、List集合
1.List接口介绍及常用方法
1) List集合类中元素有序(即添加顺序和取出顺序一致)、 且可重复[案例]
2) List集合中的每个元素都有其对应的顺序索引,即支持索引。[案例]
3) List容器中的元素都对应一 个整数型的序号记载其在容器中的位置,可以根
据序号存取容器中的元素。
2.ArrayList底层分析
2.1 ArrayList基本介绍
1) permits all elements, including null , ArrayList可以加入null,并且可以添加多个null
2) ArrayList底层是由可变数组来实现数据存储的
3) ArrayList基本等同于Vector ,除了ArrayList是线程不安全(执行效率高),在多线程情况下,不建议使用ArrayList
2.2 ArrayList的底层底层结构及扩容机制
1) ArrayList中维护了一个Object类型的数组elementData. [debug 看源码] transient Object[] elementData; //transient 表示瞬间、短暂的,表示该属性不会被序列化
2)当创建ArrayList对象时,如果使用的是无参构造器,则初始elementData容量为0, 第1次添加,则扩容elementData为10, 如大小不够需要再次扩容,则调用grow()扩容elementData为1.5倍。grow()内部数据拷贝使用Arrays.Copyof()。
3)如果使用的是指定大小的构造器,则初始elementData容量为指定大小, 如果需要扩容,则直接扩容elementData为1.5倍。
3.Vector底层分析
3.1 Vector基本介绍
1) Vector底层也是一个对象数组,protected Object[] elementData;
2) Vector是线程同步的,即线程安全,Vector类的操作方法带有synchronized
public synchronized E get(int index)
if (index >= elementCount)
throw new ArrayIndexOutOfBoundsException(index);
return elementData(index);
3)在开发中,需要线程同步安全时,考虑使用Vector
3.2 Vector与ArrayList的比较(扩容机制)
4.LinkedList底层分析
4.1 LinkedList基本介绍
1) LinkedList底层实现了双向链表和双端队列特点
2)可以添加任意元素(元素可以重复),包括null
3)线程不安全,没有实现同步
4.2 LinkedList底层结构
1) LinkedList底层维护了一个双向链表
2) LinkedList中维护了两个属性first和last分别指向首节点和尾节点
3)每个节点(Node对象) ,里面又维护了prev、next、 item三个属性,其中通过prev指向前一 个,通过next指向后个节点,而item就是真正存放数据的属性。最终实现双向链表
4)所以LinkedList的元素的添加和删除,不是通过数组完成的,相对来说效率较高,添加是添加在双向链表的尾部,remove()不指定索引默认删除的是第一个数据
4.3 ArrayList和LinkedList的比较
四、Set集合
1.Set接口介绍及常用方法
1)无序(添加和取出的顺序不一致) ,没有索引后面演示]
2)不允许重复元素,所以最多包含一个null
2.HashSet底层分析
2.1 HashSet基本介绍
1) HashSet实际上是HashMap(jdk1.7:数组+链表 jdk1.8:数组+链表+红黑树 ),看下源码
public HashSet()
map = new HashMap<>();
2)可以存放null值,但是只能有一个null
3) HashSet不保证元素是有序的,取决于hash后,再确定索引的结果
4)不能有重复元素/对象在前面Set接口使用已经讲过
2.2 HashSet底层结构及源码解读
1. HashSet 底层是HashMap
2.添加一个元素时,先得到hash值-会转成->索引值
3.找到存储数据表table ,看这个索引位置是否已经存放的有元素
4.如果没有,直接加入
5.如果有,调用equals比较,如果相同,就放弃添加,如果不相同,则添加到最后
6.在Java8中,如果一条链表的元素个数到达TREEIFY THRESHOLD(默认是8),并且table的大小>=MIN TREEIFY CAPACITY(默认64),就会进行树化(红黑树)
public class Debug03 public static void main(String[] args)
//添加实例 HashSet set = new HashSet(); set.add("java"); set.add("php"); set.add("java"); System.out.println(set); /* 源码解读 1. 执行HashSet() public HashSet() map = new HashMap<>(); 2. 执行add() public boolean add(E e) //e="java" return map.put(e, PRESENT)==null; // (static) PRESENT = new Object(); 3. 执行put(),该方法会执行hash(key)得到key对应的hash值 算法 (h = key.hashCode()) ^ (h >>> 16) 避免碰撞 public V put(K key, V value) //key="java" value=PRESENT 共享的 return putVal(hash(key), key, value, false, true); 4. 执行putVal() final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) Node<K,V>[] tab; Node<K,V> p; int n, i; //定义了辅助变量 // table就是HashMap的一个数组,类型是Node[] // if 语句表示如果当前table 是null或者 大小 = 0,就是第一次扩容,到16 if ((tab = table) == null || (n = tab.length) == 0) n = (tab = resize()).length; //(1)根据key,得到hash 去计算该key应该存放到table表的哪个索引位置,并把这个位置的对象,赋给 p //(2)判断p 是否为null //(2.1)如果p 为null,表示还没有存放元素,就创建一个Node(key="java",value=PRESENT) //(2.2)就放在该位置 tab[i] = newNode(hash, key, value, null) if ((p = tab[i = (n - 1) & hash]) == null) tab[i] = newNode(hash, key, value, null); else // 一个开发技巧提示:在需要局部变量(辅助变量)时候,再创建 Node<K,V> e; K k; // 如果当前索引位置对应的链表的第一个元素和准备添加的key的hash值一样 // 并且满足 下面两个条件之一: //(1)准备加入的key 和 p 指向的Node节点的key是同一个对象 //(2)p指向的node节点的key的equals() 和准备加入的key比较后相同 // 就不能加入 if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k)))) e = p; // 再判断 p 是不是一颗红黑树, // 如果是一颗红黑树,就调用 putTreeVal,来进行添加 else if (p instanceof TreeNode) e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value); // 如果table对应的索引位置,已经是一个链表,就使用for循环比较 //(1)依次和该链表的每一个元素比较后,都不相同,则加入到该链表的最后 // 注意在把元素添加到链表后,立即判断该链表是否已经达到8个结点 // 就调用treeifyBin() 对当前这个链表进行树化(转成红黑树) // 注意,在转成红黑树时,要进行判断,判断条件 // if (tab == null | (n = tab.Length) < MIN_ TREEIFY_ CAPACITY(64) ) // resize() ; // 如果上面条件成立,先table扩容。 // 只有上面条件不成立时,才进行转成红黑树 //(2)依次和该链表的每一个元素比较过程中,如果有相同情况,就直接break else for (int binCount = 0; ; ++binCount) //死循环 if ((e = p.next) == null) p.next = newNode(hash, key, value, null); if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st treeifyBin(tab, hash); break; if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) break; p = e; if (e != null) // existing mapping for key V oldValue = e.value; if (!onlyIfAbsent || oldValue == null) e.value = value; afterNodeAccess(e); return oldValue; ++modCount;
//size 就是我们加入一个节点Node(k,v,h,next),size++ if (++size > threshold) resize(); //扩容 afterNodeInsertion(evict); return null; */
2.3 HashSet扩容及树化机制
1. HashSet底层是HashMap,第一次添加时,table 数组扩容到16,临界值(threshold)是16*加载因子(loadFactor)是0.75 = 12
2.如果table数组使用到了临界值12,就会扩容到16* 2 = 32,新的临界值就是32*0.75 = 24,依次类推正
3.在Java8中,如果条链表的元素个数到达TREEIFY THRESHOLD(默认是8 ),并且table的大小>=MIN TREEIFY CAPACITY(默认64),就会进行树化(红黑树),否则仍然采用数组扩容机制
3.LinkedHashSet底层分析
1)LinkedHashSet加入顺序和取出元素,数据的顺序一致
2) LinkedHashSet 底层维护的是一个LinkedHashMap(是HashMap的子类)
3) LinkedHashSet 底层结构( 数组table+双向链表)
4) 第一次添加元素时,直接将数组tabLe扩容到16 ,存放的结点类型是LinkedHashMap$Entry 每一个节点有before、after分别指向前一个和后一个元素
5)数组是HashMap$Node[] 存放的元素/数据是L inkedHashMap$Entry类型
4.TreeSet底层分析
4.1 TreeSet基本介绍
1)当我们使用无参构造器, 创建TreeSet时,仍然是无序的,存储数据的底层结构是TreeMap$Entry
2)若希望添加的元素,按照字符串字典顺序来排序
3)使用Treeset提供的一一个构造器,可以传入-个比较器(匿名内部类) 并指定排序规则
4.2 TreeSet源码解读
public class TreeSet_ public static void main(String[] args) //TreeSet treeSet = new TreeSet(); //4、简单看下源码 TreeSet treeSet = new TreeSet(new Comparator() @Override public int compare(Object o1, Object o2) // 下面 调用String的compareTo方法进行字符串 字典顺序 排序 // return ((String)o1).compareTo((String)o2); // 如果按照长度大小排序 小-->大 return ((String)o1).length()-((String)o2).length(); ); treeSet.add("jack"); treeSet.add("tom"); treeSet.add("sp"); treeSet.add("a"); System.out.println(treeSet); /* 源码解读: 1.构造器把传入的比较器对象,赋给了TreeSet的底层的TreeMap的属性this。comparator public TreeMap(Comparator<? super K> comparator) this.comparator = comparator; 2、在 调用treeSet.add("tom"),在底层会执行到 if (cpr != null) //cpr 就是我们的匿名内部类(对象) do parent = t; //动态的绑定到我们的匿名内部类(对象)compare cmp = cpr.compare(key, t.key); if (cmp < 0) t = t.left; else if (cmp > 0) t = t.right; else //如果相等,即返回0,这个key就没有加入 V oldValue = t.value; if (replaceOld || oldValue == null) t.value = value; return oldValue; while (t != null); */
五、Map集合
1.Map接口介绍及常用方法
1) Map与Collection并列存在。用于保存具有映射关系的数据:Key-Value
2) Map中的key和value 可以是任何引用类型的数据,会封装到HashMap$Node对象中
3) Map中的key不允许重复,原因和HashSet一样,前面分析过源码
4) Map中的value可以重复
5) Map的key可以为null, value也可以为null ,注意key为null,只能有一个,value 为null ,可以多个
6)常用String类作为Map的key
7) key和value之间存在单向一对一关系,即通过指定的key总能找到对应的value
8) Map存放数据的key-value示意图,一对k-v是放在一个HashMap$Node中的, 又因为Node实现了Entry 接口,有些书上也说一对k-v就是一个Entry
2.Map集合的六种遍历方式
public class Map01 public static void main(String[] args) Map map = new HashMap(); map.put(1, "张三"); map.put(2, "李四"); map.put(3, "王五"); map.put(4, "赵六"); map.put(5, "田七"); //第一组:先取出所有的key,通过key取出对应的value Set set = map.keySet(); //(1)增强for for (Object key : set) System.out.println(key + "-" + map.get(key)); //(2)迭代器 Iterator iterator = set.iterator(); while (iterator.hasNext()) Object key = iterator.next(); System.out.println(key + "-" + map.get(key)); //第二组:把所有的values取出 Collection values = map.values(); //这里可以使用所有的Collection使用的遍历方法 //(1)增强for for (Object value : values) System.out.println(value); //(2)迭代器 Iterator iterator1 = values.iterator(); while (iterator1.hasNext()) Object values2 = iterator1.next(); System.out.println(values2); //第三组:通过EntrySet 获取 k-v //(1)增强for Set entrySet = map.entrySet(); for (Object entry : entrySet) //将entry 转成 Map.Entry Map.Entry m = (Map.Entry) entry; System.out.println(m.getKey()+"-"+m.getValue()); //(2)迭代器 Iterator iterator2 = entrySet.iterator(); while (iterator2.hasNext()) Object entry = iterator2.next(); Map.Entry m = (Map.Entry) entry; System.out.println(m.getKey()+"-"+m.getValue());
3.HashMap底层分析
3.1 HashMap基本介绍
1) Map接口的常用实现类: HashMap、 Hashtable和Properties。
2) HashMap是Map接口使用频率最高的实现类。
3) HashMap是以key-val对的方式来存储数据[案例Entry ]
4) key不能重复,但是是值可以重复,允许使用null键和null值。
5)如果添加相同的key ,则会覆盖原来的key-val ,等同于修改.(key不会替换,val会替换)
6)与HashSet-样,不保证映射的顺序,因为底层是以hash表的方式来存储的.
7) HashMap没有实现同步,因此是线程不安全的
3.2 HashMap底层扩容(和HashSet相同)及源码解读
1) HashMap底层维护了Node类型的数组table,默认为null
2)当创建对象时,将加载因子(loadfactor)初始化为0.75.
3)当添加key-val时,通过key的哈希值得到在table的索引。然后判断该索引处是否有元素,如果没有元素直接添加。如果该索引处有元素,继续判断该元素的key和准备加入的key相是否等,如果相等,则直接替换val;如果不相等需要判断是树 结构还是链表结构,做出相应处理。如果添加时发现容量不够,则需要扩容
4)第1次添加,则需要扩容table容量为16,临界值(threshold)为12.
5)以后再扩容,则需要扩容table容量为原来的2倍,临界值为原来的2倍,即24,依次类推
6)在Java8中,如果条链表的元素个数超过TREEIFY THRESHOLD(默认是8),并且table的大小>= MIN TREEIFY CAPACITY(默认64),就会进行树化(红黑树)
public class HashMapDebug public static void main(String[] args) HashMap hashMap=new HashMap(); hashMap.put("java",10); hashMap.put("php",20); hashMap.put("java",30); //替换 10 System.out.println(hashMap); /*HashMap源码解读 1、执行构造器 new HashMap() 初始化加载因子 loadfactor=0.75 HashMap$Node[] table = null 2、执行put() 调用 hash方法,计算key的hash值 (h = key.hashCode()) ^ (h >>> 16) public V put(K key, V value) key="java" value=10 return putVal(hash(key), key, value, false, true); 3、执行putVal() final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) Node<K,V>[] tab; Node<K,V> p; int n, i; //辅助变量 //如果底层的table数组为空,或者长度等于0,就进行第一次扩容到16 if ((tab = table) == null || (n = tab.length) == 0) n = (tab = resize()).length; //取出hash值对应的table的索引位置的Node,如果为null,就直接把加入的k-v创建成一个Node,加入该位置即可 if ((p = tab[i = (n - 1) & hash]) == null) tab[i] = newNode(hash, key, value, null); else Node<K,V> e; K k; //辅助变量 //如果tabLe的索引位置的key的hash相同和新的key的hash值相同, //并 满足(tabLe现有的结点的key和准备添加的key是同一个对象 || equals返回真) if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k)))) e = p; else if (p instanceof TreeNode) //如果当前的table的已有的Node 是红黑树,就按照红黑树的方式处理 e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value); else //如果找到的节点 后面是链表,就循环比较 for (int binCount = 0; ; ++binCount) //死循环 if ((e = p.next) == null) //如果整个链表,没有和他相同,就加在该链表的最后 p.next = newNode(hash, key, value, null); //加入后,判断当前链表的个数,是否到达8个,到达8个后 //就调用treeifyBin()进行红黑树的转化 if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st treeifyBin(tab, hash); break; if (e.hash == hash && //如果在循环比较过程中,发现有相同,就break,替换value ((k = e.key) == key || (key != null && key.equals(k)))) break; p = e; if (e != null) // existing mapping for key V oldValue = e.value; if (!onlyIfAbsent || oldValue == null) e.value = value; //替换,key对应的value afterNodeAccess(e); return oldValue; ++modCount; //每增加一个Node,就size++ if (++size > threshold) //如 size > 临界值,就扩容 resize(); afterNodeInsertion(evict); return null; 5. 关于树化(转成红黑树) //如果table为null,或者大小还没有到64,暂时不树化,而是进行扩容 //否则才会正真的树化 -> 剪枝 final void treeifyBin(Node<K,V>[] tab, int hash) int n, index; Node<K,V> e; if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY) resize(); ...... */
4.HashTable底层分析
4.1 HashTable基本介绍
1) 存放的元素是键值对: 即K-V
2) hashtable的键和值都不能为null, 否则会抛出NullPointerException
3) hashTable使用方法基本上和HashMap-样
4) hashTable是线程安全的(synchronized), hashMap是线程不安全的
4.2 HashTable底层扩容机制
1) 底层有数组Hashtable$Entry[] 初始化大小为11
2) 临界值threshold 8 = 11 * 0.75
3) 扩容:按照自己的扩容机制来进行即可。
4) 执行方法addEntry(hashp key, value, index); 添加K-V 封装到Entry
5) 当if (count >= threshoLd) 满足时,就进行扩容
6) 按照int newCapacity = (oldCapacity << 1) + 1;的大小扩容。
4.3 HashTable和HashMap对比
5.TreeMap底层分析
5.1 TreeMap基本介绍
使用默认 的构造器,创建TreeMap, 是无序的( 也是没有排序的)
compare方法的比较条件若相同 则不添加 而不是替换
5.2 TreeMap底层源码
public class TreeMap_ public static void main(String[] args) //TreeMap treeMap= new TreeMap(); TreeMap treeMap = new TreeMap(new Comparator() @Override public int compare(Object o1, Object o2) //要求:按照传入的 k(String) 的 字典顺序 进行排序 //return ((String)o1).compareTo((String)o2); //按照字符串的长度大小排序 小-->大 return ((String)o1).length()-((String)o2).length(); ); treeMap.put("jack","杰克"); treeMap.put("tom","汤姆"); treeMap.put("kiri","凯瑞");//"kiri"长度和"jack"长度相等无法加入 treeMap.put("smith","史密斯"); System.out.println(treeMap); /* 源码解读: 1. 构造器:把实现了 Comparator接口的匿名内部类(对象),传给了TreeMap的comparator public TreeMap(Comparator<? super K> comparator) this.comparator = comparator; 2. 调用put方法 2.1 第一次添加,把k-v封装到Entry对象,放入root Entry<K,V> t = root; if (t == null) addEntryToEmptyMap(key, value); return null; 2.2 以后添加 Comparator<? super K> cpr = comparator; if (cpr != null) do //遍历所有的key,给当前的key找到适当的位置 parent = t; cmp = cpr.compare(key, t.key); //动态的绑定到我们的匿名内部类的compare if (cmp < 0) t = t.left; else if (cmp > 0) t = t.right; else //如果遍历过程中,发现准备添加的key 和当前已有的key相等(compare比较),就不添加 V oldValue = t.value; if (replaceOld || oldValue == null) t.value = value; return oldValue; while (t != null); */
六、Collections工具类
1) Collections是个操作 Set、List和Map等集合的工具类
2) Collections中提供了一系列静态的方法对集合元素进行排序、查询和修改等操作
排序操作
1) reverse(List):反转List中元素的顺序
2) shuffle(List):对List集合元素进行随机排序
3) sort(List):根据元素的自然顺序对指定List集合元素按升序排序
4) sort(List, Comparator): 根据指定的Comparator产生的顺序对List集合元素进行排序
5) swap(List, int, int): 将指定list集合中的i处元素和j处元素进行交换
查找、替换
1) Object max(Collection):根据元素的自然顺序,返回给定集合中的最大元素
2) Object max(Collection, Comparator): 根据Comparator指定的顺序,返回给定集合中的最大元素
3) Object min(Collection)
4) Object min(Collection, Comparator)
5) int frequency(Collection, Object): 返回指定集合中指定元素的出现次数
6)void copy(List dest,List src):将src中的内容复制到dest中
7) boolean replaceAll(List list, Object oldVal, Object newVal):使用新值替换List对象的所有旧值
本笔记参考视频:https://www.bilibili.com/video/BV1YA411T76k?p=55(其他的集合源码的debug可以去看老韩讲解的视频)
以上是关于java集合专题 (ArrayListHashSet等集合底层结构及扩容机制HashMap源码)的主要内容,如果未能解决你的问题,请参考以下文章
Java集合专题总结:HashMap 和 HashTable 源码学习和面试总结