日本综合一区二区|亚洲中文天堂综合|日韩欧美自拍一区|男女精品天堂一区|欧美自拍第6页亚洲成人精品一区|亚洲黄色天堂一区二区成人|超碰91偷拍第一页|日韩av夜夜嗨中文字幕|久久蜜综合视频官网|精美人妻一区二区三区

RELATEED CONSULTING
相關(guān)咨詢
選擇下列產(chǎn)品馬上在線溝通
服務(wù)時間:8:30-17:00
你可能遇到了下面的問題
關(guān)閉右側(cè)工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案
給我1萬字,也講Java不清內(nèi)存排查。1萬不行來2萬~.~

本文轉(zhuǎn)載自微信公眾號「小姐姐味道」,可以通過以下二維碼關(guān)注。轉(zhuǎn)載本文請聯(lián)系小姐姐味道公眾號。

對于內(nèi)存問題排查來說,搞理論的痛苦,搞實踐的也痛苦,沒有一片清凈之地。

why?因為內(nèi)存溢出是Java碼農(nóng)永遠(yuǎn)的傷。

溢出有很多種解釋,有精滿自溢,有緩沖區(qū)溢出攻擊,還有另外一種叫做領(lǐng)導(dǎo)的溢出。不知道什么叫作溢出理論,xjjdog在此普及一下。

《領(lǐng)導(dǎo)看了會炸毛的溢出理論》

內(nèi)存溢出什么最重要?其實,內(nèi)存溢出就像是一場交通事故。事故的發(fā)生方,就是具體的服務(wù);事故的處理方,就是相關(guān)的程序員。其中有一個最重要的環(huán)節(jié),就是在事故現(xiàn)場需要拍照取證。

如果沒有照片沒有行車記錄儀沒有證據(jù),就只能靠那張嘴,怎么說都是不可信的。

**這句話很重要很重要:內(nèi)存問題排查什么最重要?當(dāng)然是信息收集,留下一些為我們的排查提供支持的依據(jù)。**千萬不要舍本逐末,對內(nèi)存問題排查本身感興趣,那是自虐行為。

有很多工具可以幫助我們定位問題,但前提是你得把它留下來。下面這篇文章是xjjdog很久之前留下來的,由于標(biāo)題的緣故,你可能忽略了,但這些工具能夠快速幫我們定位問題。

 
 
 
 
  1. ss -antp > $DUMP_DIR/ss.dump 2>&1
  2. netstat -s > $DUMP_DIR/netstat-s.dump 2>&1
  3. top -Hp $PID -b -n 1 -c >  $DUMP_DIR/top-$PID.dump 2>&1
  4. sar -n DEV 1 2 > $DUMP_DIR/sar-traffic.dump 2>&1
  5. lsof -p $PID > $DUMP_DIR/lsof-$PID.dump
  6. iostat -x > $DUMP_DIR/iostat.dump 2>&1
  7. free -h > $DUMP_DIR/free.dump 2>&1
  8. jstat -gcutil $PID > $DUMP_DIR/jstat-gcutil.dump 2>&1
  9. jstack $PID > $DUMP_DIR/jstack.dump 2>&1
  10. jmap -histo $PID > $DUMP_DIR/jmap-histo.dump 2>&1
  11. jmap -dump:format=b,file=$DUMP_DIR/heap.bin $PID > /dev/null  2>&1

GC日志配置

但并不是每次出現(xiàn)故障,你都在機器的身邊。靠人工也不能保證實時性。所以,強烈建議你把GC日志輸出的詳細(xì)一些,那么出現(xiàn)問題的時候就舒坦一些。

實際上,這個要求在我看來是強制的。

很多同學(xué)上來就說,我的內(nèi)存溢出了。但你和它要一些日志信息,要堆棧,要現(xiàn)場保存的快照。都沒有。這就是純粹來搞笑的。

下面是JDK8或者以下的GC日志參數(shù),可以看到還是很長的。

 
 
 
 
  1. #!/bin/sh
  2. LOG_DIR="/tmp/logs"
  3. JAVA_OPT_LOG=" -verbose:gc"
  4. JAVA_OPT_LOG="${JAVA_OPT_LOG} -XX:+PrintGCDetails"
  5. JAVA_OPT_LOG="${JAVA_OPT_LOG} -XX:+PrintGCDateStamps"
  6. JAVA_OPT_LOG="${JAVA_OPT_LOG} -XX:+PrintGCApplicationStoppedTime"
  7. JAVA_OPT_LOG="${JAVA_OPT_LOG} -XX:+PrintTenuringDistribution"
  8. JAVA_OPT_LOG="${JAVA_OPT_LOG} -Xloggc:${LOG_DIR}/gc_%p.log"
  9. JAVA_OPT_OOM=" -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=${LOG_DIR} -XX:ErrorFile=${LOG_DIR}/hs_error_pid%p.log "
  10. JAVA_OPT="${JAVA_OPT_LOG} ${JAVA_OPT_OOM}"
  11. JAVA_OPT="${JAVA_OPT} -XX:-OmitStackTraceInFastThrow"

下面是JDK9及其以上的日志配置??梢钥吹剿呐渲梅绞饺兞?,而且不向下兼容。Java搞的這個變化還是挺蛋疼的。

 
 
 
 
  1. #!/bin/sh
  2. LOG_DIR="/tmp/logs"
  3. JAVA_OPT_LOG=" -verbose:gc"
  4. JAVA_OPT_LOG="${JAVA_OPT_LOG} -Xlog:gc,gc+ref=debug,gc+heap=debug,gc+age=trace:file=${LOG_DIR}/gc_%p.log:tags,uptime,time,level"
  5. JAVA_OPT_LOG="${JAVA_OPT_LOG} -Xlog:safepoint:file=${LOG_DIR}/safepoint_%p.log:tags,uptime,time,level"
  6. JAVA_OPT_OOM=" -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=${LOG_DIR} -XX:ErrorFile=${LOG_DIR}/hs_error_pid%p.log "
  7. JAVA_OPT="${JAVA_OPT_LOG} ${JAVA_OPT_OOM}"
  8. JAVA_OPT="${JAVA_OPT} -XX:-OmitStackTraceInFastThrow"
  9. echo $JAVA_OPT

一旦發(fā)現(xiàn)了問題,就可以拿GC日志來快速定位堆內(nèi)問題。但是并不是讓你一行行去看,那太低效了。因為日志可能會很長很長,而且也不一定看得懂。這個時候,就可以使用一些在線工具輔助解決。我經(jīng)常使用的是gceasy,下面是它的一張截圖。

 
 
 
 
  1. http://gceasy.io

有了GC日志還不行,因為它僅僅是記錄了堆空間的一些變化,至于操作系統(tǒng)的一些資源變動,它是無從知曉的。所以,如果你有一個監(jiān)控系統(tǒng)的話,在尋找問題的時候也能幫到忙。從下圖可以看到系統(tǒng)資源的一些變動。

溢出示例

堆溢出

代碼。

日志。

 
 
 
 
  1. java -Xmx20m -Xmn4m -XX:+HeapDumpOnOutOfMemoryError - OOMTest
  2. [18.386s][info][gc] GC(10) Concurrent Mark 5.435ms
  3. [18.395s][info][gc] GC(12) Pause Full (Allocation Failure) 18M->18M(19M) 10.572ms
  4. [18.400s][info][gc] GC(13) Pause Full (Allocation Failure) 18M->18M(19M) 5.348ms
  5. Exception in thread "main" java.lang.OutOfMemoryError: Java heap space
  6.     at OldOOM.main(OldOOM.java:20)

jvisualvm的反應(yīng)。

元空間溢出

代碼。

日志。

 
 
 
 
  1. java -Xmx20m -Xmn4m -XX:+HeapDumpOnOutOfMemoryError -XX:MetaspaceSize=16M -XX:MaxMetaspaceSize=16M MetaspaceOOMTest
  2. 6.556s][info][gc] GC(30) Concurrent Cycle 46.668ms
  3. java.lang.OutOfMemoryError: Metaspace
  4. Dumping heap to /tmp/logs/java_pid36723.hprof ..

jvisualvm的反應(yīng)。

直接內(nèi)存溢出

代碼。

日志。

 
 
 
 
  1. java -XX:MaxDirectMemorySize=10M -Xmx10M OffHeapOOMTest
  2. Exception in thread "Thread-2" java.lang.OutOfMemoryError: Direct buffer memory
  3.     at java.nio.Bits.reserveMemory(Bits.java:694)
  4.     at java.nio.DirectByteBuffer.(DirectByteBuffer.java:123)
  5.     at java.nio.ByteBuffer.allocateDirect(ByteBuffer.java:311)
  6.     at OffHeapOOMTest.oom(OffHeapOOMTest.java:27)...

棧溢出

代碼。

日志。

 
 
 
 
  1. java -Xss128K StackOverflowTest
  2. Exception in thread "main" java.lang.StackOverflowError
  3.     at java.io.PrintStream.write(PrintStream.java:526)
  4.     at java.io.PrintStream.print(PrintStream.java:597)
  5.     at java.io.PrintStream.println(PrintStream.java:736)
  6.     at StackOverflowTest.a(StackOverflowTest.java:5)

哪些代碼容易出現(xiàn)問題

忘記重寫hashCode和equals

看下面的代碼。由于沒有重寫Key類的hashCode和equals方法。造成了放入HashMap的所有對象,都無法被取出來。它們和外界失聯(lián)了。

下面這篇文章詳細(xì)的描述了它的原理。

結(jié)果集失控

不要覺得這段代碼可笑。在實際工作中的review中,xjjdog不止一次發(fā)現(xiàn)這種蛋疼的代碼。這有可能是趕工期,也有可能是剛學(xué)會寫Java。這行代碼有很大的可能性踩坑。

條件失控

代碼。與之類似的就是條件失控,當(dāng)某個條件不滿足的時候,將會造成結(jié)果集的失控。大家可以看下面的代碼,fullname 和 other為空的時候,會出現(xiàn)什么后果?

萬能參數(shù)

還有的同學(xué)使用各種Object和HashMap來進(jìn)行信息交換。這種代碼正常運行的時候沒什么問題,但一旦出錯,幾乎無法排查。排查參數(shù)、排查堆棧、排查調(diào)用鏈,全部失效。

一些預(yù)防的措施

  • 減少創(chuàng)建大對象的頻率:比如byte數(shù)組的傳遞
  • 不要緩存太多的堆內(nèi)數(shù)據(jù):使用guava的weak引用模式
  • 查詢的范圍一定要可控:如分庫分表中間件;ES等有同樣問題
  • 用完的資源一定要close掉:可以使用新的 try-with-resources語法
  • 少用intern:字符串太長,且無法復(fù)用,就會造成內(nèi)存泄漏
  • 合理的Session超時時間
  • 少用第三方本地代碼,使用Java方案替代
  • 合理的池大小
  • XML(SAX/DOM)、JSON解析要注意對象大小

案例分析一

這是最常見的一種情況。了解了這種方式,能夠應(yīng)對大多數(shù)內(nèi)存溢出和內(nèi)存泄漏問題。

現(xiàn)象

  • 環(huán)境:CentOS7,JDK1.8,SpringBoot
  • G1垃圾回收器
  • 剛啟動沒什么問題,慢慢放量后,發(fā)生了OOM
  • 系統(tǒng)自動生成了heapdump文件
  • 臨時解決方式:重啟,但問題依然發(fā)現(xiàn)

信息收集

  • 日志:GC的日志信息:內(nèi)存突增突降,變動迅速
  • 堆棧:Thread Dump文件:大部分阻塞在某個方法上
  • 壓測:使用wrk進(jìn)行壓測,發(fā)現(xiàn)20個用戶并發(fā),內(nèi)存溢出
 
 
 
 
  1. wrk -t20 -c20 -d300s http://127.0.0.1:8084/api/test

MAT分析

堆棧文件獲?。?/p>

 
 
 
 
  1. jmap -dump:format=b,file=heap.bin 37340
  2. jhsdb jmap  --binaryheap --pid  37340

MAT工具是基于eclipse平臺開發(fā)的,本身是一個Java程序。分析Heap Dump文件:發(fā)現(xiàn)內(nèi)存創(chuàng)建了大量的報表對象。

通過菜單Find Leaks,一鍵找出黑李逵。

根據(jù)提示向下挖就可以。

解決

分析結(jié)果:

  • 系統(tǒng)存在大數(shù)據(jù)量查詢服務(wù),并在內(nèi)存做合并
  • 當(dāng)并發(fā)量達(dá)到一定程度,會有大量數(shù)據(jù)堆積到內(nèi)存進(jìn)行運算

解決方式:

  • 重構(gòu)查詢服務(wù),減少查詢的字段
  • 使用SQL查詢代替內(nèi)存拼接,避免對結(jié)果集的操作
  • 舉例:查找兩個列表的交集

案例分析二

現(xiàn)象

  • 環(huán)境:CentOS7,JDK1.8,JBoss
  • CMS垃圾回收器
  • 操作系統(tǒng)CPU資源耗盡
  • 訪問任何接口,響應(yīng)都非常的慢

分析

  • 發(fā)現(xiàn)每次GC的效果都特別好,但是非常頻繁
  • 了解到使用了堆內(nèi)緩存,而且設(shè)置的容量比較大
  • 緩存填充的速度特別快!

結(jié)論:

  • 開了非常大的緩存,GC之后迅速占滿,造成GC頻繁

案例分析三

  • 現(xiàn)象java進(jìn)程異常退出
  • java進(jìn)程直接消失
  • 沒有留下dump文件
  • GC日志正常
  • 監(jiān)控發(fā)現(xiàn)死亡時,堆內(nèi)內(nèi)存占用很少,堆內(nèi)仍有大量剩余空間

分析

  • XX:+HeapDumpOnOutOfMemoryError不起作用
  • 監(jiān)控發(fā)現(xiàn)操作系統(tǒng)內(nèi)存持續(xù)增加

下面這些情況都會造成程序退出而沒什么響應(yīng)。

  • 被操作系統(tǒng)殺死 dmesg oom-killer
  • System.exit()
  • java com.cn.AA & 后終端關(guān)閉
  • kill -9

解決

發(fā)現(xiàn):

  • 在dmesg命令中發(fā)現(xiàn)確實被oom-kill

解決:

  • 給JVM少分配一些內(nèi)存,騰出空間給其他進(jìn)程

當(dāng)前標(biāo)題:給我1萬字,也講Java不清內(nèi)存排查。1萬不行來2萬~.~
網(wǎng)址分享:http://www.dlmjj.cn/article/cceppio.html