經(jīng)驗不在于年限，在于積累---專注互聯(lián)網(wǎng)軟件開發(fā)

把工作當事業(yè)做，把項目當作品做！

:: 管理

55 Posts :: 0 Stories :: 66 Comments :: 0 Trackbacks

利用Hadoop分析BHO上報日志時，發(fā)現(xiàn)很多日志文件會出現(xiàn)下面的錯誤：

即在map結(jié)束的時候拋出Java堆棧溢出異常！

（友情提示：本博文章歡迎轉(zhuǎn)載，但請注明出處：hankchen，http://m.tkk7.com/hankchen）

首先設(shè)置下面的參數(shù)：

發(fā)現(xiàn)還是解決不了問題。開始懷疑代碼問題，于是進行了一系列的優(yōu)化：

主要的優(yōu)化是，在map和reduce程序中，重用key和value對象。但是發(fā)現(xiàn)還是解決不了問題。并且mapred.child.java.opts設(shè)置3G也無濟于事。

沒有辦法，只好繼續(xù)找原因。最后發(fā)現(xiàn)一個規(guī)律：報這個異常出錯的日志不一定是最大的日志。

只好使用最后一招了，直接分析報錯時的Java堆內(nèi)存情況！

再次出現(xiàn)異常的時候，把集群里面所有的機器的Hadoop進程的堆內(nèi)存導出來分析！

主要是下面的幾類進程：

同時，關(guān)注每臺機器的top命令輸出，可以從內(nèi)存的使用情況中發(fā)現(xiàn)主要是哪臺機器出問題！然后重點導出這臺機器的Java堆參數(shù)！

jmap -dump:live,format=b,file=heapt0923.bin pid

剩下來的就是把/data/bhopid_output/heapt0923.bin這個文件復制到本地，利用Eclipse Memory Analyzer Tool 進行分析！

下面是分析的結(jié)果：

發(fā)現(xiàn)有兩個內(nèi)存泄漏的情況：

1、

2、

找到根本原因：說明日志文件有這樣很大的空記錄導致的！在代碼中把這些記錄忽略掉即可！

（友情提示：本博文章歡迎轉(zhuǎn)載，但請注明出處：hankchen，http://m.tkk7.com/hankchen）

posted on 2012-03-21 17:52 hankchen 閱讀(8817) 評論(0) 編輯收藏所屬分類: 工作感悟


只有注冊用戶登錄后才能發(fā)表評論。




網(wǎng)站導航: 博客園 IT新聞 Chat2DB C++博客博問管理
相關(guān)文章: 從經(jīng)理的角度看技術(shù)債務(wù)【轉(zhuǎn)】游戲數(shù)據(jù)平臺規(guī)劃線上應用故障排查系列線上應用故障排查之二：高內(nèi)存占用線上應用故障排查之一：高CPU占用 jstack -F 命令在Linux 64位機器報錯：get_thread_regs failed for a lwp 給開發(fā)維護大型項目開發(fā)者的建議 zz 利用Eclipse Memory Analyzer Tool（MAT）分析內(nèi)存泄漏如何學好java---JavaIDC技術(shù)總監(jiān)給新進技術(shù)人員的建議 zz 工作感悟---系統(tǒng)優(yōu)化經(jīng)歷