HashCode与Equals回顾

折月煮酒 提交于 2020-03-13 00:53:47

HashSet和HashMap一直都是JDK中最常用的两个类,HashSet要求不能存储相同的对象,HashMap要求不能存储相同的键。 那么Java运行时环境是如何判断HashSet中相同对象、HashMap中相同键的呢?当存储了“相同的东西”之后Java运行时环境又将如何来维护呢? 
在研究这个问题之前,首先说明一下JDK对equals(Object obj)和hashcode()这两个方法的定义和规范:

(1)在Java中任何一个对象都具备equals(Object obj)和hashcode()这两个方法,因为他们是在Object类中定义的。 equals(Object obj)方法用来判断两个对象是否“相同”,如果“相同”则返回true,否则返回false。 hashcode()方法返回一个int数,在Object类中的默认实现是“将该对象的内部地址转换成一个整数返回”。

(2)接下来有两个个关于这两个方法的重要规范(我只是抽取了最重要的两个,其实不止两个):

规范1若重写equals(Object obj)方法,有必要重写hashcode()方法(避免不必要的麻烦),确保通过equals(Object obj)方法判断结果为true的两个对象具备相等的hashcode()返回值。说得简单点就是:“如果两个对象相同,那么他们的hashcode应该 相等”。不过请注意:这个只是规范,如果你非要写一个类让equals(Object obj)返回true而hashcode()返回两个不相等的值,编译和运行都是不会报错的。不过这样违反了Java规范,程序也就埋下了BUG。

规范2:如果equals(Object obj)返回false,即两个对象“不相同”,并不要求对这两个对象调用hashcode()方法得到两个不相同的数。说的简单点就是:“如果两个对象不相同,他们的hashcode可能相同”。 根据这两个规范,

可以得到如下推论

1、如果两个对象equals,Java运行时环境会认为他们的hashcode一定相等。

2、如果两个对象不equals,他们的hashcode有可能相等。

3、如果两个对象hashcode相等,他们不一定equals。

4、如果两个对象hashcode不相等,他们一定不equals

(3)

对于一般类的对象(除String等封装类型对象外):

若普通类没有重写hashcode()和equals()方法,,那么其对象在比较时,是继承的object类中的hashcode()方法,object类中的hashcode()方法是一个本地方法,对该方法的返回值进行比较时,比较的是对象的地址(引用地址),使用new方法创建内容相同的对象,两次生成的当然是不同的对象。除非重写hashcode()方法。在object类中定义的equals()方法也是对对象地址的比较。一句话总结:若不重写普通类的hashcode()和equals()方法,在Set集合中对象引用地址不一样,对象即不重复。

 对于String等对象(String、Integer、Double····等等):

由于这些封装类本身已经重写了hashcode()方法,并且重写的方法的返回值跟对象的内容相关,而不是跟引用地址相关。这些封装类中的equals()方法同样进行了重写,比较的是对象的内容,而非引用地址。一句话总结:String等类的对象在集合中均比较他们的内容,内容相同则覆盖已存在的对象

(4)set集合为什么可以保证元素的不重复性,根本是:在添加元素时会进行是否相等的判断。根源是:

Java中的Set集合 怎么保障不重复? 

大家可能都知道Set是一个无序的不可以重复的集合。凡事想一个为什么? 
打开源码看一眼: 
Set是一个接口,常用的Set实现类那就是HashSet了。 
------------------------------------------------- 
public HashSet() { 
map = new HashMap<E,Object>(); 
    } 
------------------------------------------------- 

这是HashSet的构造方法。 可以看到HashSet内部其实就是一个HashMap 
【添加元素的方法】 
/**  
     * 如果此set中尚未包含指定元素,则添加指定元素。  
     * 更确切地讲,如果此 set 没有包含满足(e==null ? e2==null : e.equals(e2))  
     * 的元素e2,则向此set 添加指定的元素e。  
     * 如果此set已包含该元素,则该调用不更改set并返回false。  
     *  
     * 底层实际将将该元素作为key放入HashMap。  
     * 由于HashMap的put()方法添加key-value对时,当新放入HashMap的Entry中key  
     * 与集合中原有Entry的key相同(hashCode()返回值相等,通过equals比较也返回true),  
     * 新添加的Entry的value会将覆盖原来Entry的value,但key不会有任何改变,  
     * 因此如果向HashSet中添加一个已经存在的元素时,新添加的集合元素将不会被放入HashMap中,  
     * 原来的元素也不会有任何改变,这也就满足了Set中元素不重复的特性。  
     * @param e 将添加到此set中的元素。  
     * @return 如果此set尚未包含指定元素,则返回true。  
     */ 
public boolean add(E e) { 
return map.put(e, PRESENT)==null; 
    } 
看一下map的定义: 
HashSet 中定义了这样的两个变量: 
    private transient HashMap<E,Object> map; 
    private static final Object PRESENT = new Object(); 
我们再看一下上面的 add() 方法。 
map.put(o, PRESENT)==null 
实际执行的是 map 的方法,并且我们添加的对象是 map 中的 key,value 是执行的同一个对象 PRESENT. 
因为map中的key是不允许重复的,所以set中的元素不能重复。 
============================================================================== 
根本问题还是没有解决那继续问?为什么HashMap中的Key不允许重复? 
HashMap的往里放元素的源码!!! 

public V put(K key, V value) { 
        if (key == null) 
            return putForNullKey(value); 
        int hash = hash(key.hashCode()); 
        int i = indexFor(hash, table.length); 
        //遍历链表 
        for (Entry<K,V> e = table[i]; e != null; e = e.next) { 
            Object k; 
            //如果key在链表中已存在,则替换为新value  HashMap 可以重复put同一个Key值不同的对象。 
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) { 
                V oldValue = e.value; 
                e.value = value; 
                e.recordAccess(this); 
                return oldValue; 
            } 
        } 

        modCount++; 
        addEntry(hash, key, value, i); 
        return null; 
    } 

分步骤判断添加的Key值: 
1、取到新添加Key值得hashCode值。 
2、确定数组的index 根据Key的hashCode值和当前table的长度按位取并  h & (length-1); 
    按位取并,作用上相当于取模mod或者取余%。 
    这意味着数组下标相同,并不表示hashCode相同 
3、这里的hashcode在equals前面,JVM会先判断或运算||的前部分,当这一前部分为true的时候判断终止,返回true(这是为了提高JVM的效率),所以当hashcode不同的时候,equals是不会执行的。 


总结为什么Set里面不能有重复? 
因为HashMap在put一个Key时会判断,将要放进去的Key的hash值与 目前HashMap中定位到的那个Key的hash值比较。 
如果hash值相当,继续比较 这两个对象的地址或者内容是否相当。 
如果相当:判断出来要添加的Key与HashMap中的Key重复,把Value的值给替换成最新的。 
HashSet中的Value是一个固定值PRESENT。 所以修改不修改无所谓。 

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!