深入理解 Java 之 HashMap 源码解析

08-19, 2016

Java 集合框架源码分析系列之 HashMap

文章来源：itsCoder 的 WeeklyBolg 项目
itsCoder主页：http://itscoder.com/
作者：allenwu
审阅者：Jaeger,JoeSteven

引言

我们都知道 HashMap 输出是无序的。是因为存储时候 HashMap 会根据 key 值来决定 value 的存储位置。但是我们想过没有？到底为什么输出的时候顺序会跟存储时候不一样呢？JDK1.7 中的 HashMap 底层构造与 JDK1.8 中有哪些区别呢？HashCode() 的作用是什么呢？另外如果你不熟悉集合的基本常用用法可以参见Java 基本集合用法总结。

一 . 初识 HashMap

在 JDK 1.7 之前的：HashMap 的内部存储结构其实是数组和链表的结合。当实例化一个 HashMap 时，系统会创建一个长度为 Capacity 的 Entry 数组，这个长度在哈希表中被称为容量(Capacity)，在这个数组中可以存放元素的位置我们称之为“桶”(bucket)，每个 bucket 都有自己的索引，系统可以根据索引快速的查找 bucket 中的元素。

每个 bucket 中存储一个元素，即一个 Entry 对象，但每一个 Entry 对象可以带一个引用变量，用于指向下一个元素，因此，在一个桶中，就有可能生成一个 Entry 链。

可如下图表示：

Crazy Java 上面说了，发生冲突的元素以链表形式存储，必须按顺序搜索。Hash 表包含如下属性：

容量(capacity):hash 表中桶的数量，也就是上面 Entry 数组的长度。
初始化容量(inital capacity)。
尺寸(size):当前 Hash 表中记录的数量。
负载因子(load factor):size/capacity。负载因子为 0 则表示为空的 Hash 表，0.5 表示半满的 Hash 表。轻负载的具有冲突少，适宜插入与查询的特点。
负载极限：当 Hash 表中的负载因子达到指定的极限时，Hash 表会自动的增加桶的数量，重新分配，这种行为被称为 rehash。

总之默认加载因子 (0.75) 在时间和空间成本上寻求一种折衷。加载因子过高虽然减少了空间开销，但同时也增加了查询成本（在大多数 HashMap 类的操作中，包括 get 和 put 操作，都反映了这一点）。在设置初始容量时应该考虑到映射中所需的条目数及其加载因子，以便最大限度地减少 rehash 操作次数。如果初始容量大于最大条目数除以加载因子，则不会发生 rehash 操作。

处理Hash冲突的方法

二 . JDK1.7 中的 HashMap

我们首先来分析一下 JDK1.7 中的 HashMap 相关定义和实现原理。下面是常量,属性以及构造函数的定义：

2.1 常量定义

// table 数组即 Entry 数组的初始容量
static final int DEFAULT_INITIAL_CAPACITY = 16;
// 最大的容量，左移即 2 的 30 次方
static final int MAXIMUM_CAPACITY = 1 << 30;
// 负载因子
static final float DEFAULT_LOAD_FACTOR = 0.75f;
// 储存 key-value 键值对的数组，一个键值对对象映射一个Entry对象
transient Entry[] table;
// 键值对的数目
transient int size;
// 调整 HashMap 大小门槛，该变量包含了HashMap 能容纳的 key-value 对的极限，它的值等于 HashMap 的容量乘以负载因子
int threshold;
// 加载因子
final float loadFactor;
// HashMap 结构修改次数,防止在遍历时，有其他的线程在进行修改
transient volatile int modCount;

注：位移操作在底层源码中应用还挺多的，可以一定程度上替代乘法和除法(效率好吧)，解释一下位移操作：

例如：3 « 2( 3 为 int 型)

　　1. 把3转换为二进制数字 0000 0000 0000 0000 0000 0000 0000 0011，　　2. 把该数字高位(左侧)的两个零移出，其他的数字都朝左平移 2 位，　　3. 在低位(右侧)的两个空位补零。则得到的最终结果是 0000 0000 0000 0000 0000 0000 0000 1100，

　　转换为十进制是 12。

上面只是一个例子总结起来就是：左移运算符，num « 1,相当于 num 乘以2。同理右移。而对于上述这个例子就是 3 乘以 2 的 2 次方啦，即 3 乘以 4 等于 12.

另外一个知识点是 transient 关键字：这个关键字是在对象序列化过程中，除掉那个你不想序列化的变量。一般你为了方便会将实体对象实现 Serilizable 接口，但是其中某几个变量你不想序列化，就可以用这个关键字修饰。另外 transient 只能修饰变量,静态变量不管是否被其修饰均不能实现序列化。

继而扩展一下 volatile 关键字：volatile 是为解决 Java 线程并发而产生的。为了解决线程并发的问题，在语言内部引入了同步块和 volatile 关键字机制。而对 volatile 的使用大家也可能不是很明白。具体使用和详情可以参见这里。

2.2 构造函数

public HashMap(int initialCapacity, float loadFactor) {
	// 初始大小为 0 即抛出异常
if (initialCapacity < 0)
		throw new IllegalArgumentException("Illegal initial capacity: "
				+ initialCapacity);
	// 初始大小超过指定的最大值，则容量为指定的最大值
	if (initialCapacity > MAXIMUM_CAPACITY)
		initialCapacity = MAXIMUM_CAPACITY;
	// 负载因子也不能为 0
	if (loadFactor <= 0 || Float.isNaN(loadFactor))
		throw new IllegalArgumentException("Illegal load factor: "
				+ loadFactor);
	// Find a power of 2 >= initialCapacity
	int capacity = 1;
	// 使得capacity 的大小为2的幂
	while (capacity < initialCapacity)
		capacity <<= 1;
	this.loadFactor = loadFactor;
	// size 超过这个数值就会扩容,即其为阈值
	threshold = (int) (capacity * loadFactor);
	table = new Entry[capacity];
	init();
}

2.3 Get() 函数源码

public V get(Object key) {
  	// key 为 null 的情况
    if (key == null)
        return getForNullKey();
  	// key ！= null 的情况
    int hash = hash(key.hashCode());
    // 遍历 table 
        for (Entry<K,V> e = table[indexFor(hash, table.length)];
             e != null;
             e = e.next) {
            Object k;
          	// 相等则返回 e.value
            if (e.hash == hash && ((k = e.key) == key || key.equals(k)))
                return e.value;
    }
    return null;
}

当 key 为 null 时候：

private V getForNullKey() {
 // 遍历 table[0] 的链表
    for (Entry<K,V> e = table[0]; e != null; e = e.next) {
         if (e.key == null)
           return e.value;
   }
  return null;
}

该方法是一个私有方法，只在 get() 中被调用。该方法判断 table[0] 中的链表是否包含 key 为 null 的元素，包含则返回 value，不包含则返回 null。为什么是遍历 table[0] 的链表？因为 key 为 null 的时候获得的 hash 值都是 0。

2.4 Put() 函数源码

注意下 putForNullKey( ) 这个函数,说明 HashMap 是允许 key 为 Null 的。源码分析如下：

public V put(K key, V value) {
	// 即上图的 Entry 数组为空，则初始化
    if (table == EMPTY_TABLE) {
            inflateTable(threshold);
    }
	// put 进去的 key 为空的话,去 putForNullKey(value)这个方法存放
    if (key == null)
        return putForNullKey(value);
	// key 不为空，计算 hashkey
    int hash = hash(key);
	// 根据 hashkey 找到在 Entry 数组中的位置
    int i = indexFor(hash, table.length);
	// 每个位置都是一个链表，循环直到找到有位置，当前 Entry 数组位置 e 存在
	// 每个节点都有一个 next 索引 指向 链的下一个节点
  	// 这种情况是 Entry 数组上已经插入了元素。
    for (Entry<K,V> e = table[i]; e != null; e = e.next) {
          Object k;
          // 找到指定 key 与需要放入的 key 相等（hash 值相同  
     	  // 通过 equals 比较放回 true）
       	  if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
				// 返回原来这个位置上的值
                return oldValue;
            }
        }
    // 表示更改了一次底层数据结构
    modCount++;
	// 此时进行元素的插入，添加至索引 i 处
    addEntry(hash, key, value, i);
    return null;
}
// addEntry 方法中会检查当前 table 是否需要 resize
void addEntry(int hash, K key, V value, int bucketIndex) {
		// Entry 桶位不为空，就是已经插入了值，并且 size 大于 一定的量了
        if ((size >= threshold) && (null != table[bucketIndex])) {
		// 当前 map 中的 size 如果大于 threshole 的阈值，则 resize 将 table 的 length 扩大2倍。
            resize(2 * table.length); 
            hash = (null != key) ? hash(key) : 0;
            bucketIndex = indexFor(hash, table.length);
        }
		//增加数组的长度
        createEntry(hash, key, value, bucketIndex);
}

下面就是对数组进行扩容了，很自然的问一句什么时候进行扩容？通过上面我们知道了，HashMap 有一个冲突因子一般折中取值为 0.75，而数组的默认长度为 16，所以当 HashMap 数组中的元素 超过了 12 就会进行扩容 resize(2 * table.length) 由这一句可以看出，扩大一倍，即32，然后还要重新计算数据元素的位置。

void resize(int newCapacity) {
	// 将旧数组元素输出
    Entry[] oldTable = table;
	// 将旧数组容量输出保存
   	int oldCapacity = oldTable.length;
	// 如果说旧容量已经达到最大的容量了
   	if (oldCapacity == MAXIMUM_CAPACITY) {
		// 这里表示整形能够表示的最大数值，在前面 ArrayList 中应该也有
        threshold = Integer.MAX_VALUE;
        return;
     }
    // 构造一个新的 table 数组
    Entry[] newTable = new Entry[newCapacity];
	// 转移 数据
    transfer(newTable, initHashSeedAsNeeded(newCapacity));
    table = newTable;
	// 计算新表的 负载极限
    threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);
	}
	// 将当前 table 的 Entry 转移到新的 table 中
void transfer(Entry[] newTable, boolean rehash) {
	// 新 table 的容量
    int newCapacity = newTable.length;
	// 将原 table 中数据迭代输出
    for (Entry<K,V> e : table) {
        while(null != e) {
                Entry<K,V> next = e.next;
                if (rehash) {
                    e.hash = null == e.key ? 0 : hash(e.key);
                }
				// 重新计算索引了
                int i = indexFor(e.hash, newCapacity);
                e.next = newTable[i];
                newTable[i] = e;
                e = next;
            }
      }
}

另外底下这个算法(公式)是用来计算 Hash 数值的，加入了高位计算，防止低位不变，高位变化时，降低造成的 Hash 冲突。但是实际的原理不是很懂。

static int hash(int h) {  
    h ^= (h >>> 20) ^ (h >>> 12);  
    return h ^ (h >>> 7) ^ (h >>> 4);  
}

同时也在前面一段代码也看到了 indexFor( )—顾名思义，他就是用来寻找在 Entry 数组（即 table 表），相应 Hash 数值所在的位置。这个要重点说下，一般对哈希表的散列很自然地会想到用Hash 值对 length 取模（即除法散列法），Hashtable 中也是这样实现的，这种方法基本能保证元素在哈希表中散列的比较均匀，但取模会用到除法运算，效率很低，HashMap 中则通过 h&(length-1) 的方法来代替取模，同样实现了均匀的散列，但效率要高很多，这也是 HashMap 对 Hashtable 的一个改进。源码的精妙之处啊！

static int indexFor(int h, int length) {  
    return h & (length-1);  
}

另外一个 Fail-Fast 机制，这个的出现就是因为 HashMap 是 线程不安全的，也就是说如果同时几个线程对 HashMap 进行修改，将会抛出异常，而这个机制的实现就是因为 modCount 。我们每一次，对 HashMap 的操作这个数值都会增加，而且也是全局的。

HashIterator() {
    expectedModCount = modCount;
    if (size > 0) { // advance to first entry
    Entry[] t = table;
    while (index < t.length && (next = t[index++]) == null)
        //...
   }
}

final Entry<K,V> nextEntry() {     
    if (modCount != expectedModCount)     
        throw new ConcurrentModificationException();

看见上面的 modCount != expectedModCount 吗？如果不相等，就表示其他线程已经修改了，这时候就会抛出异常。从而保证 HashMap 是线程安全的。另外，我们自然想到上面这段代码可以在别的线程中，那么modCount 的同步性就很重要，其他线程要时刻知道它的数值，这时候 voliate 关键字就可以做到了。如下可验证：

// HashMap结构修改次数,防止在遍历时，有其他的线程在进行修改  
transient volatile int modCount;

现在我们解决一下引言中的疑问: HashMap 不保证元素输出时和添加时顺序一致，为什么呢？

个人感觉就是因为扩容然后重新分配的原因，虽然在 我们用户(写代码的) 在 put() 元素进入 HashMap 的时候没感觉到，但是底层机制应该时刻都在检查要不要扩容，要不要重新分配，这样动态的过程很难保证元素的顺序不变。

这样，jdk 7 中就差不多了，这种方法最大的缺点就是：一旦所有的 key 都相同(极端情况)，即冲突，HashMap 就会退化成一个链表(即在 table 表中的同一个位置不停的放置元素)，get() 的复杂度就会变成 o(n)。

所以 jdk 8 为了优化这一点，采用了红黑树来解决这些超过一定量的键值对。

三 . JDK1.8 中的 HashMap

上面就是 JDK 1.8 中数据的存储方式，很明显看见了一颗红黑树。

3.1 常量数值的定义

// 最开始的容量，必须是 2 的次方，这里即 2 的 4 次方
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
// 最大容量
static final int MAXIMUM_CAPACITY = 1 << 30;
// 负载
static final float DEFAULT_LOAD_FACTOR = 0.75f;
// list to tree 的临界值
static final int TREEIFY_THRESHOLD = 8;
// 删除冲突节点后，hash相同的节点数目小于这个数，红黑树就恢复成链表
static final int UNTREEIFY_THRESHOLD = 6;
// 扩容的临界值
static final int MIN_TREEIFY_CAPACITY = 64;
// 存储元素的数组
transient Node<k,v>[] table;

3.2 Node 节点定义

// 继承自 Map.Entry<K,V>
static class Node<K,V> implements Map.Entry<K,V> {
       final int hash;
       final K key;
       V value;
	   // 指向下一个节点
       Node<K,V> next;
       Node(int hash, K key, V value, Node<K,V> next) {
            this.hash = hash;
            this.key = key;
            this.value = value;
            this.next = next;
        }
        public final K getKey()        { return key; }
        public final V getValue()      { return value; }
        public final String toString() { return key + "=" + value; }
		// 返回 Hash 值
        public final int hashCode() {
            return Objects.hashCode(key) ^ Objects.hashCode(value);
        }

        public final V setValue(V newValue) {
            V oldValue = value;
            value = newValue;
            return oldValue;
        }
		// 重写 equals() 
        public final boolean equals(Object o) {
            if (o == this)
                return true;
            if (o instanceof Map.Entry) {
                Map.Entry<?,?> e = (Map.Entry<?,?>)o;
                if (Objects.equals(key, e.getKey()) &&
                    Objects.equals(value, e.getValue()))
                    return true;
            }
            return false;
        }
}

3.3 构造函数

public HashMap(int initialCapacity, float loadFactor) {
       // 同上 jdk 1.7
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal initial capacity: " +
                                               initialCapacity);
        if (initialCapacity > MAXIMUM_CAPACITY)
            initialCapacity = MAXIMUM_CAPACITY;
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal load factor: " +
                                               loadFactor);
        this.loadFactor = loadFactor;
        this.threshold = tableSizeFor(initialCapacity);
    }

计算 key 的 Hash 采用的函数,但是这个不是真正的索引，索引在后面还要进行一次运算。

static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

3.4 红黑树定义

static final class TreeNode<K,V> extends LinkedHashMap.Entry<K,V> {
        TreeNode<K,V> parent;  // 父
        TreeNode<K,V> left;    // 左
        TreeNode<K,V> right;   // 右
        TreeNode<K,V> prev;    // needed to unlink next upon deletion
        boolean red;           // 判断颜色
        TreeNode(int hash, K key, V val, Node<K,V> next) {
            super(hash, key, val, next);
        }
        // 返回根节点
        final TreeNode<K,V> root() {
            for (TreeNode<K,V> r = this, p;;) {
                if ((p = r.parent) == null)
                    return r;
                r = p;
       }

3.5 put() 函数

public V put(K key, V value) {
    // 调用 putVal() 函数 
   return putVal(hash(key), key, value, false, true);
}
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
		// tab 没有分配初始的空间或者为空，就 resize 一次
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
		// 指定 hash 值节点为空则直接在tab表中插入，注意这里 (n - 1) & hash 才是真正的 hash 值
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
		// 不为空
        else {
            Node<K,V> e; K k;
			// 计算当前节点的 key.hash 与要插入的 key.hash
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
				// 相同则覆盖
                e = p; 
			// 若不同的话，并且当前节点已经在 TreeNode 上了
            else if (p instanceof TreeNode)
				// 创建新的树节点
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
			// key.hash 不同并且也不再 TreeNode 上，在链表上找到 p.next==null
            else {
                for (int binCount = 0; ; ++binCount) {
                    if ((e = p.next) == null) {
						// 表示在表尾插入
                        p.next = newNode(hash, key, value, null);
						// 新增节点后如果节点个数到达阈值，则进入 treeifyBin() 进行再次判断
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
							// 这里有可能还会跟64比较，判断是否需要对 table 进行扩容
                            treeifyBin(tab, hash);
                        break;
                    }
					// 如果找到了同hash、key的节点，那么直接退出循环
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
					// 更新 p 指向下一节点
                    p = e;
                }
            }
			// 退出循环后的操作，hash 和 key 都相同，则覆盖更新
            if (e != null) { 
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }

3.5 getNode() 函数

get() 函数最终还是要通过 getNode() 来进行操作：

final Node<K,V> getNode(int hash, Object key) {
    Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
    // table 已经初始化，长度大于 0，根据 hash 寻找 table 中的项也不为空
    if ((tab = table) != null && (n = tab.length) > 0 &&
        (first = tab[(n - 1) & hash]) != null) {
        // 桶中第一项(数组元素)相等
        if (first.hash == hash && // always check first node
            ((k = first.key) == key || (key != null && key.equals(k))))
            return first;
        // 桶中不止一个结点
        if ((e = first.next) != null) {
            // 为红黑树结点
            if (first instanceof TreeNode)
                // 在红黑树中查找
                return ((TreeNode<K,V>)first).getTreeNode(hash, key);
            // 否则，在链表中查找
            do {
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    return e;
            } while ((e = e.next) != null);
        }
    }
    return null;
}

3.6 resize() 函数

扩容函数，指的是对 table 表进行的操作，resize() 函数分析如下：

final Node<K,V>[] resize() {
    Node<K,V>[] oldTab = table;
    int oldCap = (oldTab == null) ? 0 : oldTab.length;
    int oldThr = threshold;
    int newCap, newThr = 0;
    // 对 newCap 的取值
    if (oldCap > 0) {
         if (oldCap >= MAXIMUM_CAPACITY) {
                threshold = Integer.MAX_VALUE;
                return oldTab;
     }
            else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                     oldCap >= DEFAULT_INITIAL_CAPACITY)
                newThr = oldThr << 1; // double threshold
     }
        else if (oldThr > 0) // initial capacity was placed in threshold
            newCap = oldThr;
        else {               // zero initial threshold signifies using defaults
            newCap = DEFAULT_INITIAL_CAPACITY;
            newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
        }
        if (newThr == 0) {
            float ft = (float)newCap * loadFactor;
            newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                      (int)ft : Integer.MAX_VALUE);
        }
    	//...
                  while ((e = next) != null);
				  // 这里就是冲突的链表分成两个队列存储
                     if (loTail != null) {
                            loTail.next = null;
                            newTab[j] = loHead;
                    }
                    if (hiTail != null) {
                            hiTail.next = null;
                            newTab[j + oldCap] = hiHead;
                        }
                    }
                }
            }
        }
        return newTab;
    }

3.7 treeifyBin() 函数

判断是对 table 表进行扩容 还是将冲突节点调整成红黑树：

final void treeifyBin(Node<K,V>[] tab, int hash) {
    int n, index; Node<K,V> e;
	// table 为空或者 table 的桶位还没达到 64，进行 table 扩容，而不是红黑调整
    if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
            resize();
    // >=64,进行红黑树转化
       else if ((e = tab[index = (n - 1) & hash]) != null) {
            TreeNode<K,V> hd = null, tl = null;
            do {
                TreeNode<K,V> p = replacementTreeNode(e, null);
                if (tl == null)
                    hd = p;
                else {
                    p.prev = tl;
                    tl.next = p;
                }
                tl = p;
            } while ((e = e.next) != null);
            if ((tab[index] = hd) != null)
              // 调整成红黑树  
              hd.treeify(tab);
    }
}

四. hashCode() 的作用

面试经常会问到 hashCode() 是干嘛的？什么时候重写 equals() 方法啊？

引用自hashCode的作用
关于hashCode的作用　　总的来说，Java中的集合（Collection）有两类，一类是List，再有一类是Set。前者集合内的元素是有序的，元素可以重复；后者元素无序，但元素不可重复。要想保证元素不重复，可两个元素是否重复应该依据什么来判断呢？这就是Object.equals方法了。但是，如果每增加一个元素就检查一次，那么当元素很多时，后添加到集合中的元素比较的次数就非常多了。也就是说，如果集合中现在已经有1000个元素，那么第1001个元素加入集合时，它就要调用1000次equals方法。这显然会大大降低效率。于是，Java采用了哈希表的原理。哈希算法也称为散列算法，是将数据依特定算法直接指定到一个地址上。这样一来，当集合要添加新的元素时，先调用这个元素的hashCode方法，就一下子能定位到它应该放置的物理位置上。如果这个位置上没有元素，它就可以直接存储在这个位置上，不用再进行任何比较了；如果这个位置上已经有元素了，就调用它的equals方法与新元素进行比较，相同的话就不存了；不相同，也就是发生了Hash key相同导致冲突的情况,那么就在这个Hash key的地方产生一个链表,将所有产生相同hashcode的对象放到这个单链表上去,串在一起。所以这里存在一个冲突解决的问题（很少出现）。这样一来实际调用equals方法的次数就大大降低了，几乎只需要一两次。所以，Java对于eqauls方法和hashCode方法是这样规定的： 1、如果两个对象相等，那么它们的hashCode值一定要相等； 2、如果两个对象的hashCode相等，它们并不一定相等(在同一个链表上)。

在上述第二种情况下，若要判断两个对象是否相等，就要去重写 equals() 方法了。简单来讲 hashCode() 是用来查找用的，equals() 是用来判断两个对象是否相等用的。而我们进一步看看 Java 官方文档对于 hashCode() 定义要求：

hashcode方法返回该对象的哈希码值。支持该方法是为哈希表提供一些优点，例如，java.util.Hashtable 提供的哈希表。
hashCode 的常规协定是：在 Java 应用程序执行期间，在同一对象上多次调用 hashCode 方法时，必须一致地返回相同的整数，前提是对象上 equals 比较中所用的信息没有被修改。从某一应用程序的一次执行到同一应用程序的另一次执行，该整数无需保持一致。如果根据 equals(Object) 方法，两个对象是相等的，那么在两个对象中的每个对象上调用 hashCode 方法都必须生成相同的整数结果。以下情况不是必需的：如果根据 equals(java.lang.Object) 方法，两个对象不相等，那么在两个对象中的任一对象上调用 hashCode 方法必定会生成不同的整数结果。但是，程序员应该知道，为不相等的对象生成不同整数结果可以提高哈希表的性能。实际上，由 Object 类定义的 hashCode 方法确实会针对不同的对象返回不同的整数。（这一般是通过将该对象的内部地址转换成一个整数来实现的，但是 JavaTM 编程语言不需要这种实现技巧。）
当equals方法被重写时，通常有必要重写 hashCode 方法，以维护 hashCode 方法的常规协定，该协定声明相等对象必须具有相等的哈希码。

可以看这里的实例告诉我们为什么重写 hashCode() 时有必要重写 equals() 方法。

五 . 个人总结

上面说了很多，由于 HashMap 有三种数据结构，数组即 table 表，链表，红黑树。我们很自然考虑到，每种结构达到什么程度时，table 会进行扩容,链表会向红黑树转化。

总结就是当 table 数达到 64 后，冲突节点数为 8 时，则进行链表向树结构转换，也就是说当 table 表还未达到 64时，每个桶位冲突的 key 达到 8 个以及上时，我们会一边进行 table 表的扩容，一边会将冲突的链表分成两个队列，而此时并没有将链表向红黑树转换。这些操作都在 resize() 中。

六. 参考和扩展阅读

由于篇幅原因，更多集合框架源码分析请看这里。

如果觉得本文对你有帮助，请打赏以回报我的劳动