from:http://wangkaisino.blog.163.com/blog/static/1870444202011431112323846/


今年年初由于facebook而火起jemalloc人之,但殊不知,malloc界里面很早就出名了。Jemalloc始人Jason Evans也是在FreeBSD很有名的開發。此人就在2006提高低性能的mallocjemallocJemalloc2007始以FreeBSD準引進來的。件技革新很多是FreeBSD起的。在FreeBSD用廣泛的技術會慢慢入到linux

目前jemallocfirefox中也在使用。在firefox2中出存碎片問題之后,便在firefox3中使用了jemalloc。在safarichrome中使用的是googletcmalloc

Jemalloc的技特性

Jemalloc聚集了malloc的使用程中所驗證的很多技。忽略細節著眼,最出色的部分仍是arenathread cache。(事上,這兩個與tcmalloc的架幾乎相同。Jemalloc only的部分將會在另一次posting繼續

Arena

其像malloc集中管理一整塊內存,不如其分成塊來分而治之。此小便稱為arena想象一下,小朋友一圖紙們隨意地點。果可想而知,他肯定相互方而不敢肆意地synchronization),而影響畫圖效率。但是如果老事先在大圖紙分好每人的域,小朋友就可以又快又準地在各自地域上畫圖這樣念就是arena

Thread cache

如果是辟小塊內存,使不arena而直接malloc各自的thread cache域。此ideagoogletcmalloc的核心部分,亦在jemalloc中體

再拿上面的例子,小朋友除了一圖紙外,再各自A4這樣,小朋友在不大面的點,只在自己的A4上心情地即可(no arena seeking)。可以在自己手上的或涂(using thread cache),完全不用人(no synchronization, no locking),迅速有效地

jemalloc的核心layout。看著復雜,其都是上面明的部分。

更好的內存管理-jemalloc - Alex - wangkaisino的博客
 

實際jemalloc的性能呢?

更好的內存管理-jemalloc - Alex - wangkaisino的博客
 

最左的就是glibcmalloc,最右的就是jemalloc從圖表上可以看出,jemalloc的性能有glibc倍以上。非常倒性的性能差。因此,使用了jemalloc用程序自然快很多。Jemalloc的就是tcmallocTcmalloc的性能其相差甚微,低jemalloc2.1.04.5%上和tcmalloc1.4版本,而如今到了1.6版本,因此實際這兩應該是不相仲伯的。Jemalloc始人jason evans也意一點,cpu core 8以上的算機上jemalloc效率更高。

程序的最后的免午餐 – kth分布式技lab      

2005表了一篇文章免費午餐的時代結束了在之前,程序就算不用費腦子,cpu時鐘速度增加,程序性能自己就上去。但在不同,cpu時鐘趨定,而核地增加。程序需要適應這樣的多程多程的境,開發出適合的程序。文章的大這樣容。

6年之后的如今,篇文章完全現實了。事cpu時鐘停留在3GHz,而核不上升。在程序要適程多程的分布式算,速度才能上升。但是這樣的程序很

在在多程的境下,程序員們的最后一道午餐便是tcmallocjemalloc這樣malloc library于使用多程的程序而言,性能提高%

共享一下我本人的經驗。我本人在kth術研究所分布式技lab中承擔iLock(分布式同步工具,請參googlechubby)。在iLock中用了googletcmalloc果,性能提升了18~22%

最大的點就是不需要做任何復雜的工作便可得到這樣的效果。不需要代編譯。只需在行二制之前,在cmd窗口中

$ LD_PRELOAD=tcmalloc所設置的文件夾/libtcmalloc.so

這樣在之后行的用程序使用tcmallocjemalloc而代替glibcmallocptmalloc)。置此,我便可得到性能20%的提升,這真是送的最后的免午餐。

如今,在分布式技lab中使用googletcmalloc。原因在于性能上者差不多,但googletcmalloc所提供的程序分析工具非常(heap profiler, cpu profiler)豐富。所以tcmalloc可能更方便一些。

一定要使用最新的malloc?一定要的!