HashMap深入讲解 - ToB企服应用市场:ToB评测及商务社交产业平台

static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // HashMap的默认初始容量，16
static final int MAXIMUM_CAPACITY = 1 << 30;//HashMap的最大支持容量，2^30
static final float DEFAULT_LOAD_FACTOR = 0.75f;//HashMap的默认加载因子
static final int TREEIFY_THRESHOLD = 8;//Bucket中链表长度大于该默认值，转化为红黑树
static final int UNTREEIFY_THRESHOLD = 6;//Bucket中红黑树存储的Node小于该默认值，转化为链表
/**
* 桶中的Node被树化时最小的hash表容量。
*（当桶中Node的数量大到需要变红黑树时，
* 若hash表容量小于MIN_TREEIFY_CAPACITY时，
* 此时应执行resize扩容操作这个MIN_TREEIFY_CAPACITY的值至少是TREEIFY_THRESHOLD的4倍。）
*/
static final int MIN_TREEIFY_CAPACITY = 64;
//存储元素的数组，总是2的n次幂
//通过数组存储，数组的元素是具体的Node<K,V>，这个Node有可能组成红黑树，可能是链表
transient Node<K,V>[] table;
//存储具体元素的集
transient Set<Map.Entry<K,V>> entrySet;
//HashMap中存储的键值对的数量
transient int size;
//扩容的临界值，=容量*加载因子
int threshold;
//The load factor for the hash table.
final float loadFactor;

复制代码

//空参构造，初始化加载因子
public HashMap() {
this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
}
//有参构造，可以初始化初始容量大小和加载因子
public HashMap(int initialCapacity, float loadFactor) {
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal initial capacity: " +
initialCapacity);
if (initialCapacity > MAXIMUM_CAPACITY)
initialCapacity = MAXIMUM_CAPACITY;
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal load factor: " +
loadFactor);
this.loadFactor = loadFactor;
this.threshold = tableSizeFor(initialCapacity);//扩容的临界值，= 容量*加载因子
}

复制代码

public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}

复制代码

static final int hash(Object key) {
int h;
//为什么要右移16位？默认长度为2^5=16，与hash值&操作，容易获得相同的值。
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

复制代码

// 第四个参数 onlyIfAbsent 如果是 true，那么只有在不存在该 key 时才会进行 put 操作
// 第五个参数 evict 我们这里不关心
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
if ((tab = table) == null || (n = tab.length) == 0)//初始判断，初始数组为空时
// resize()初始数组，需要进行扩容操作
n = (tab = resize()).length;
//这里就是上面的第三步，根据key的hash值找到数据在table中的位置
if ((p = tab[i = (n - 1) & hash]) == null)
//通过hash找到的数组下标，里面没有内容就直接赋值
tab[i] = newNode(hash, key, value, null);
else {//如果里面已经有内容了
Node<K,V> e; K k;
if (p.hash == hash &&
//hash相同，key也相同，那就直接修改value值
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
else if (p instanceof TreeNode)
//key不相同，且节点为红黑树，那就把节点放到红黑树里
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
//表示节点是链表
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
//添加到链表尾部
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
//如果满足链表转红黑树的条件，则转红黑树
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
//传入的K元素已经存在，直接覆盖value
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
if (++size > threshold)//检查元素个数是否大于阈值，大于就扩容
resize();
afterNodeInsertion(evict);
return null;
}

复制代码

final void treeifyBin(Node<K,V>[] tab, int hash) {
int n, index; Node<K,V> e;
//检查是否满足转换成红黑树的条件，如果数组大小还小于64，则先扩容
if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
resize();
else if ((e = tab[index = (n - 1) & hash]) != null) {
TreeNode<K,V> hd = null, tl = null;
do {
TreeNode<K,V> p = replacementTreeNode(e, null);
if (tl == null)
hd = p;
else {
p.prev = tl;
tl.next = p;
}
tl = p;
} while ((e = e.next) != null);
if ((tab[index] = hd) != null)
hd.treeify(tab);
}
}

复制代码

//table数组的扩容操作
final Node<K,V>[] resize() {
//引用扩容前的node数组
Node<K,V>[] oldTab = table;
//旧的容量
int oldCap = (oldTab == null) ? 0 : oldTab.length;
//旧的阈值
int oldThr = threshold;
//新的容量、阈值初始化为0
int newCap, newThr = 0;
//计算新容量
if (oldCap > 0) {
//如果旧容量已经超过最大容量，让阈值也等于最大容量，以后不再扩容
if (oldCap >= MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return oldTab;
}
//没超过最大值，就令newcap为原来容量的两倍
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
//如果旧容量翻倍没有超过最大值，且旧容量不小于初始化容量16，则翻倍
newThr = oldThr << 1; // double threshold
}
else if (oldThr > 0) // initial capacity was placed in threshold
//旧容量oldCap = 0时，但是旧的阈值大于0，令初始化容量设置为阈值
newCap = oldThr;
else { // zero initial threshold signifies using defaults
//两个值都为0的时候使用默认值初始化
newCap = DEFAULT_INITIAL_CAPACITY;
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
if (newThr == 0) {
//计算新阈值，如果新容量或新阈值大于等于最大容量，则直接使用最大值作为阈值，不再扩容
float ft = (float)newCap * loadFactor;
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
(int)ft : Integer.MAX_VALUE);
}
//设置新阈值
threshold = newThr;
//创建新的数组，并引用
@SuppressWarnings({"rawtypes","unchecked"})
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
table = newTab;
//如果老的数组有数据，也就是是扩容而不是初始化，才执行下面的代码，否则初始化的到这里就可以结束了
if (oldTab != null) {
//轮询老数组所有数据
for (int j = 0; j < oldCap; ++j) {
//以一个新的节点引用当前节点，然后释放原来的节点的引用
Node<K,V> e;
if ((e = oldTab[j]) != null) {//如果这个桶，不为空，说明桶中有数据
oldTab[j] = null;
//如果e没有next节点，证明这个节点上没有hash冲突，则直接把e的引用给到新的数组位置上
if (e.next == null)
//确定元素在新的数组里的位置
newTab[e.hash & (newCap - 1)] = e;
//如果是红黑树，则进行分裂
else if (e instanceof TreeNode)
((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
//说明是链表
else { // preserve order
Node<K,V> loHead = null, loTail = null;
Node<K,V> hiHead = null, hiTail = null;
Node<K,V> next;
//从这条链表上第一个元素开始轮询，如果当前元素新增的bit是0，则放在当前这条链表上
//如果是1，则放在"j+oldcap"这个位置上，生成“低位”和“高位”两个链表
do {
next = e.next;
if ((e.hash & oldCap) == 0) {
if (loTail == null)
loHead = e;
else
//元素是不断的加到尾部的
loTail.next = e;
//新增的元素永远是尾元素
loTail = e;
}
else {
//高位的链表与低位的链表处理逻辑一样，不断的把元素加到链表尾部
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
//低位链表放到j这个索引的位置上
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead;
}
//高位链表放到(j+oldCap)这个索引的位置上
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead;
}
}
}
}
}
return newTab;
}

复制代码