一.HashMap 简介
HashMap在程序员的开发过程中是一个十分常用的集合类,它是一个以键值对形式存在的集合类,
在开发中我们可以利用的它的一个key存在即替换的特性,实现一个更新的去重的操作。
在另一个方便我们可以利用map跟fastJson快速组成我们所需的json数据格式。
在jdk1.8之前,HashMap是以数组+链表的形式存在,put进来的key的hashCode进过扰动函数计算后得到hash值,然后该值通过(n-1)&hash计算后的到相应的位置(n代表的是数组长度),
如果发生了hash冲突,则先判断该key是否存在,如果存在那么就覆盖,否则以“拉链法”解决冲突,便组成了链表。
但在jdk1.8之后,HashMap就发生了改变,如果当前链表的长度大于阈值(默认是8)那么该链表就转换成红黑树,加快了搜索速度。
二.HashMap属性
//HashMap的默认初始容量 2^4=16
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
//HashMap的最大容量
static final int MAXIMUM_CAPACITY = 1 << 30;
//默认的装载因子当数组长度
static final float DEFAULT_LOAD_FACTOR = 0.75f;
// 当桶(bucket)上的结点数大于这个值时会转成红黑树
static final int TREEIFY_THRESHOLD = 8;
// 当桶(bucket)上的结点数小于这个值时树转链表
static final int UNTREEIFY_THRESHOLD = 6;
// 桶中结构转化为红黑树对应的table的最小大小
static final int MIN_TREEIFY_CAPACITY = 64;
// 存储元素的数组,总是2的幂次倍
transient Node<k,v>[] table;
// 存放具体元素的集
transient Set<map.entry<k,v>> entrySet;
// 存放元素的个数,注意这个不等于数组的长度。
transient int size;
// 每次扩容和更改map结构的计数器
transient int modCount;
// 临界值 当实际大小(容量*填充因子)超过临界值时,会进行扩容(*当size
大于等于threshold
的时候,并不一定会触发扩容机制,但是会很可能就触发扩容机制,只要有一个新建的Entry
出现哈希冲突,则立刻resize
)
int threshold;
// 填充因子 当Size>=threshold的时候,那么就要考虑对数组的扩增了,也就是说,这个的意思就是 衡量数组是否需要扩增的一个标准
final float loadFactor;
三.HashMap的扩容机制
public HashMap(int initialCapacity, float loadFactor) {
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal initial capacity: " +
initialCapacity);
if (initialCapacity > MAXIMUM_CAPACITY)
initialCapacity = MAXIMUM_CAPACITY;
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal load factor: " +
loadFactor);
this.loadFactor = loadFactor;
this.threshold = tableSizeFor(initialCapacity);
}
其中tableSizeFor这个代码是:
static final int tableSizeFor(int cap) {
int n = cap - 1;
n |= n >>> 1;
n |= n >>> 2;
n |= n >>> 4;
n |= n >>> 8;
n |= n >>> 16;
return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}
>>>是一个无视符号位的位右移动符号 |= 是左右两个数进行&操作
这个方法会把你传进来的初始化容量变成一个是2的平方次幂的数 所以这里就固定死了HashMap的容量必须是2的平方次幂
至于为什么是2的平方次幂的数原因如下:
1.put方法源码:
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
else {
Node<K,V> e; K k;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
看到其中 p = tab[i = (n - 1) & hash]) == null 这一句 (n - 1) & hash是计算到一个位置,如果这个tab中的位置是空的那么直接做插入操作。
举个列子 假设有16个位置 有4个学生都有各自的学号
名称 | 学号 |
张三 | 1 |
李四 | 2 |
王五 | 3 |
老李 | 4 |
此时我们分配位置的时候可以采用 1%16 = 1;2%16=2;3%16 = 3;4%16=4;给他们分配位置,但是考虑到性能问题。由于%操作比&慢10倍左右,因此采用&运算会提高性能。
通过限制length
是一个2的幂
数, (n - 1) & hash和hash%n结果是一致的。这就是为什么要限制容量必须是一个2
的幂的原因。
比如2的hashCode是2 那么它对应的二进制是 (0000 0010)
假设n=16
那么n-1=15对应的二进制是 1111 1111 & 0000 0010 = 1111 1111 = 0010 = 2
2%16=2
得到(n - 1) & hash和hash%n结果是一致的,考虑到性能所以每次的扩容都是以2的幂次方扩容。
四.HashMap的简单应用
public static void mapMethod() {
HashMap<String, Object> map = new HashMap<>();
map.put("zhangsan", 11);
map.put("lisi", 11);
//重复key会覆盖
map.put("zhangsan", 22);
//便利
for(String key:map.keySet()) {
//根据key获取value
System.out.println(key+"=======value:"+map.get(key));
}
//containsKey方法判断当前map是否包含该方法
System.out.println(map.containsKey("zhangsan"));
//size打印map的长度
System.out.println(map.size());
//移除key
map.remove("zhangsan");
//判断是否存在value
System.out.println(map.containsValue("22"));
}
五.总结
以上是我结合工作跟一些blog的心得写的,如果有纰漏麻烦指出. *程序员要多运动啊....减肥去了
来源:oschina
链接:https://my.oschina.net/u/4417072/blog/3646685