新聞中心
本文轉(zhuǎn)載自微信公眾號「程序新視界」,作者二師兄。轉(zhuǎn)載本文請聯(lián)系程序新視界公眾號。

上杭網(wǎng)站建設(shè)公司創(chuàng)新互聯(lián)公司,上杭網(wǎng)站設(shè)計制作,有大型網(wǎng)站制作公司豐富經(jīng)驗(yàn)。已為上杭上1000+提供企業(yè)網(wǎng)站建設(shè)服務(wù)。企業(yè)網(wǎng)站搭建\成都外貿(mào)網(wǎng)站建設(shè)要多少錢,請找那個售后服務(wù)好的上杭做網(wǎng)站的公司定做!
最近在面試的時候,當(dāng)問完了HashMap的數(shù)據(jù)結(jié)構(gòu)之后,通常會再多問一個問題,就是:重寫equals方法時通常為什么也要重寫一下hashcode方法?
其實(shí)這個問題,本質(zhì)上又回到HashMap的應(yīng)用場景了,就是想看一下面試者是否真的融會貫通。今天這篇文章就帶大家了解一下equals方法和hashcode方法之間的關(guān)系,以及相關(guān)的知識點(diǎn)。
equals與hashcode的存在
其實(shí)每個類都有一個equals方法和hashcode方法。因?yàn)樗械念惗祭^承自O(shè)bject類。Object類中定義如下:
- public boolean equals(Object obj) {
- return (this == obj);
- }
- public native int hashCode();
直觀上可以看到equals方法默認(rèn)比較的是對象的引用,直接用“==”進(jìn)行比較。而hashCode方法是一個native方法,返回值為整型。
而這兩個方法都未被final修飾,都是可以進(jìn)行重寫的。
對于我們經(jīng)常使用的比如String 、Math、Integer、Double等類,都進(jìn)行了equals()和hashCode()方法的重寫。
equals()方法
equals()方法是用來判斷兩個對象是否相等。Object默認(rèn)實(shí)現(xiàn)了equals方法,但很明顯不太符合個性化的需求,因此往往需要進(jìn)行重寫。比如常用的String類,重寫的equals方法如下:
- // 重寫equals方法
- public boolean equals(Object anObject) {
- if (this == anObject) {
- return true;
- }
- if (anObject instanceof String) {
- String anotherString = (String)anObject;
- int n = value.length;
- if (n == anotherString.value.length) {
- char v1[] = value;
- char v2[] = anotherString.value;
- int i = 0;
- while (n-- != 0) {
- if (v1[i] != v2[i])
- return false;
- i++;
- }
- return true;
- }
- }
- return false;
- }
這里的比較已不再是單純的地址比較了。首先通過地址進(jìn)行比較,如果地址相同那么肯定是相同的對象。如果地址不同就再拿char數(shù)組的內(nèi)容進(jìn)行比較,完全相等則返回true。
equals()方法的特質(zhì)
在Object類的equals方法上有注釋說明了equals()方法需滿足的一些特性:
- 自反性(reflexive)。對于任意不為null的引用值x,x.equals(x)一定是true;
- 對稱性(symmetric)。對于任意不為null的引用值x和y,當(dāng)且僅當(dāng)x.equals(y)是true時,y.equals(x)也是true;
- 傳遞性(transitive)。對于任意不為null的引用值x、y和z,如果x.equals(y)是true,同時y.equals(z)是true,那么x.equals(z)一定是true;
- 一致性(consistent)。對于任意不為null的引用值x和y,如果用于equals比較的對象信息沒有被修改的話,多次調(diào)用時x.equals(y)要么一致地返回true要么一致地返回false;
- 對于任意不為null的引用值x,x.equals(null)返回false;
對照上面特質(zhì),我們發(fā)現(xiàn)Object方法直接比較的是兩個引用地址,只有兩個地址相同才相等,也就是說是差別可能性最大的等價關(guān)系。
而String的equals方法,不僅包含應(yīng)用地址相同這種情況,還包括里面所存儲的字符串值相同的情況。也就是說雖然是兩個String對象,但是它們的字符串值相等,那么equals方法返回的結(jié)果就是true。這也正是大多數(shù)情況下我們所說的“equals方法比較的是值”。
由于Object的equals方法的默認(rèn)特例存在,因此在沒有自定義equals方法時,我們不能一概的說equals方法比較的是具體的值,而“==”比較的是引用。
hashCode()方法
hashCode()方法返回對象的一個hash code值。該方法被用于hash tables,如HashSet、HashMap。
hashCode()是一個native方法,返回值類型是整形,并且可以被重寫。
Object中的native hashCode()方法將對象在內(nèi)存中的地址作為哈希碼返回,可以保證不同對象的返回值不同。
還以String類為例,它的hashCode方法為:
- // 重寫hashCode方法
- public int hashCode() {
- int h = hash;
- if (h == 0 && value.length > 0) {
- char val[] = value;
- for (int i = 0; i < value.length; i++) {
- h = 31 * h + val[i];
- }
- hash = h;
- }
- return h;
- }
上述hash值的計算注釋中有說明,基本公式為:s[0]*31^(n-1) + s[1]*31^(n-2) + … + s[n-1]。
其中, s[i]是字符串的第i個字符,n是字符串的長度,^表示求冪(空字符串的哈希碼為0)。
計算過程中使用數(shù)字31,主要有以下原因:
1、由于質(zhì)數(shù)的特性,它與其他數(shù)字相乘之后,計算結(jié)果唯一的概率更大,哈希沖突的概率更小。
2、使用的質(zhì)數(shù)越大,哈希沖突的概率越小,但是計算的速度也越慢;31是哈希沖突和性能的折中,實(shí)際上是實(shí)驗(yàn)觀測的結(jié)果。
3、JVM會自動對31進(jìn)行優(yōu)化:31 * i == (i << 5) - i;
hashCode()方法的作用
前面提到hashCode()方法主要用于hash表中,比如HashSet、HashMap等。
我們先來看一下ArrayList,它的底層是數(shù)組,每個數(shù)據(jù)往底層的數(shù)組中存取即可,數(shù)據(jù)不需要判斷是否重復(fù)。
集合Set中的元素是無序不可重復(fù)的,那么如何確保存入的元素不重復(fù)呢?逐個調(diào)用equals()方法進(jìn)行比較?數(shù)據(jù)量少的時候還可以,但數(shù)據(jù)量大了時間復(fù)雜度基本上是O(n),會出現(xiàn)性能問題。
Java中采用哈希算法來解決這個問題,將對象(或數(shù)據(jù))依特定算法直接映射到一個地址上,這樣時間復(fù)雜度趨于O(1),對象的存取效率大大提高。
集合Set添加某元素時,先調(diào)用hashCode()方法,定位到此元素實(shí)際存儲位置,如果這個位置沒有元素,說明是第一次存儲;若此位置有對象存在,調(diào)用equals()進(jìn)行比較,相等就舍棄此元素不存,不等則散列到其他地址。
上面的示例也說明了為什么equals()相等,則hashCode()必須相等,進(jìn)而當(dāng)重寫了equals方法,也要對hashCode()方法進(jìn)行重寫。
HashMap的基本處理機(jī)制與HashSet很類似,只不過底層的數(shù)據(jù)存儲結(jié)構(gòu)有所不同而已。
簡而言之,在集合查找時,hashcode能極大的降低對象比較次數(shù),提高查找效率。
hashCode()方法的性質(zhì)
hashCode的實(shí)現(xiàn)也有一定的要求,相關(guān)英文說明在Object的equals方法注解上:
- 在一個Java應(yīng)用的執(zhí)行期間,如果一個對象提供給equals做比較的信息沒有被修改的話,該對象多次調(diào)用hashCode()方法,該方法必須始終如一返回同一個integer。
- 如果兩個對象根據(jù)equals(Object)方法是相等的,那么調(diào)用二者各自的hashCode()方法必須產(chǎn)生同一個integer結(jié)果。
- 并不要求根據(jù)equals(java.lang.Object)方法不相等的兩個對象,調(diào)用二者各自的hashCode()方法必須產(chǎn)生不同的integer結(jié)果。但對于不同的對象產(chǎn)生不同的integer結(jié)果,有可能會提高h(yuǎn)ash table的性能。
如何重寫hashCode()
《Effective Java》中提供了一種簡單通用的hashCode算法。
A、初始化一個整形變量,為此變量賦予一個非零的常數(shù)值,比如int result = 17;
B、選取equals方法中用于比較的所有域(之所以只選擇equals()中使用的域,是為了保證上述原則的第1條),然后針對每個域的屬性進(jìn)行計算:
- (1) 如果是boolean值,則計算f ? 1:0
- (2) 如果是byte\char\short\int,則計算(int)f
- (3) 如果是long值,則計算(int)(f ^ (f >>> 32))
- (4) 如果是float值,則計算Float.floatToIntBits(f)
- (5) 如果是double值,則計算Double.doubleToLongBits(f),然后返回的結(jié)果是long,再用規(guī)則(3)去處理long,得到int
- (6) 如果是對象應(yīng)用,如果equals方法中采取遞歸調(diào)用的比較方式,那么hashCode中同樣采取遞歸調(diào)用hashCode的方式。否則需要為這個域計算一個范式,比如當(dāng)這個域的值為null的時候,那么hashCode 值為0
- (7) 如果是數(shù)組,那么需要為每個元素當(dāng)做單獨(dú)的域來處理。java.util.Arrays.hashCode方法包含了8種基本類型數(shù)組和引用數(shù)組的hashCode計算,算法同上。
C、最后,把每個域的散列碼合并到對象的哈希碼中。
小結(jié)
關(guān)于equals方法很明確的是用于比較兩個對象是否相等。而對于hashCode方法重點(diǎn)是為了在類似HashMap場景下提升效率,只算是技術(shù)要求。
在集合中通常通過equals方法來比較對象是否相等,通過hashCode方法來解決大數(shù)據(jù)量時會發(fā)生的性能問題。
在實(shí)踐中我們很少使用Object對象來作為Map的key,也是因?yàn)槿绻鸒bject對象的屬性變了,會導(dǎo)致hashCode變化,進(jìn)而可能會導(dǎo)致找不到對應(yīng)值,而String是不可變的對象,作為key就很適合。
參考文章:
https://www.cnblogs.com/kismetv/p/7191736.html
https://www.iteye.com/blog/kakajw-935226
https://www.iteye.com/blog/bijian1013-1972404
當(dāng)前名稱:重寫Equals方法為什么通常會重寫Hashcode方法?
轉(zhuǎn)載來于:http://www.dlmjj.cn/article/cdsdipp.html


咨詢
建站咨詢
