Clojure
的并發(fā)(一) Ref和STM
Clojure
的并發(fā)(二)Write Skew分析
Clojure
的并發(fā)(三)Atom、緩存和性能
Clojure
的并發(fā)(四)Agent深入分析和Actor
Clojure
的并發(fā)(五)binding和let
Clojure的并發(fā)(六)Agent可以改進(jìn)的地方
Clojure的并發(fā)(七)pmap、pvalues和pcalls
Clojure的并發(fā)(八)future、promise和線程
Clojure處理并發(fā)的思路與眾不同,采用的是所謂
STM的模型——軟事務(wù)內(nèi)存。你可以將STM想象成數(shù)據(jù)庫,只不過是內(nèi)存型的,它只支持事務(wù)的ACI,也就是原子性、一致性、隔離性,但是不包括持久性,因為狀態(tài)的保存都在內(nèi)存里。
Clojure的并發(fā)API分為四種模型:
1、管理協(xié)作式、同步修改可變狀態(tài)的Ref
2、管理非協(xié)作式、同步修改可變狀態(tài)的Atom
3、管理異步修改可變狀態(tài)的Agent
4、管理Thread local變量的Var。
下面將對這四部分作更詳細(xì)的介紹。
一、Ref和STM
1、ref:
通過ref函數(shù)創(chuàng)建一個可變的引用(reference),指向一個不可變的對象:
(ref x)
例子:創(chuàng)建一個歌曲集合:
(def song (ref #{}))
2、deref和@:
取引用的內(nèi)容,解引用使用deref函數(shù)
(deref song)
也可以用reader宏@:
@song
3、ref-set和dosync:
改變引用指向的內(nèi)容,使用ref-set函數(shù)
(ref-set ref new-value)
如,我們設(shè)置新的歌曲集合,加入一首歌:
(ref-set song #{"Dangerous"})
但是這樣會報錯:
java.lang.IllegalStateException: No transaction running (NO_SOURCE_FILE:0)
這是因為引用是可變的,對狀態(tài)的更新需要進(jìn)行保護(hù),傳統(tǒng)語言的話可能采用鎖,Clojure是采用事務(wù),將更新包裝到事務(wù)里,這是通過dosync實現(xiàn)的:
(dosync (ref-set song #{"Dangerous"}))
dosync的參數(shù)接受多個表達(dá)式,這些表達(dá)式將被包裝在一個事務(wù)里,事務(wù)支持ACI:
(1)Atomic,如果你在事務(wù)里更新多個Ref,那么這些更新對事務(wù)外部來說是一個獨立的操作。
(2)Consistent,Ref的更新可以設(shè)置 validator,如果某個驗證失敗,整個事務(wù)將回滾。
(3)Isolated,運行中的事務(wù)無法看到其他事務(wù)部分完成的結(jié)果。
dosync更新多個Ref,假設(shè)我們還有個演唱者Ref,同時更新歌曲集合和演唱者集合:
(def singer (ref #{}))
(dosync (ref-set song #{"Dangerous"})
(ref-set singer #{"MJ"}) )
@song => #{"Dangerous"}
@singer => #{"MJ"}
4、alter:
完全更新整個引用的值還是比較少見,更常見的更新是根據(jù)當(dāng)前狀態(tài)更新,例如我們向歌曲集合添加一個歌曲,步驟大概是先查詢集合內(nèi)容,然后往集合里添加歌曲,然后更新整個集合:
(dosync (ref-set song (conj @song "heal the world")))
查詢并更新的操作可以合成一步,這是通過alter函數(shù):
(alter ref update-fn & args
)
alter接收一個更新的函數(shù),函數(shù)將在更新的時候調(diào)用,傳入當(dāng)前狀態(tài)值并返回新的狀態(tài)值,因此上面的例子可以改寫為:
(dosync (alter song conj "heal the world"))
這里使用conj而非cons是因為conj接收的第一個參數(shù)是集合,也就是當(dāng)前狀態(tài)值,而cons要求第一個參數(shù)是將要加入的元素。
5、commute:
commute函數(shù)是alter的變形,commute顧名思義就是要求update-function是可交換的,它的順序是可以任意排序。commute的允許的并發(fā)程度比alter更高一些,因此性能會更好。但是由于commute要求update-function是可交換的,并且會自動重排序,因此如果你的更新要求順序性,那么commute是不能接受的,commute僅可用在對順序性沒有要求或者要求很低的場景:例如更新聊天窗口的聊天信息,由于網(wǎng)絡(luò)延遲的因素和個人介入的因素,聊天信息可以認(rèn)為是天然排序,因此使用commute還可以接受,更新亂序的可能性很低。
另一個例子就不能使用commute了,如實現(xiàn)一個計數(shù)器:
(def counter (ref 0))
實現(xiàn)一個next-counter函數(shù)獲取計數(shù)器的下一個值,我們先使用commute實現(xiàn):
(defn next-counter [] (dosync (commute counter inc)))
這個函數(shù)很簡單,每次調(diào)用inc遞增counter的值,接下來寫個測試用例:啟動50個線程并發(fā)去獲取next counter:
(dotimes [_ 50] (.start (Thread. #(println (next-counter)))))
這段代碼稍微解釋下,dotimes是重復(fù)執(zhí)行50次,每次啟動new并啟動一個Thread,這個Thread里干了兩件事情:調(diào)用next-counter,打印調(diào)用結(jié)果,第一個版本的next-counter執(zhí)行下,這是其中一次輸出的截取:
23
23
23
23
23
23
23
23
23
23
23
23
28
23
21
23
23
23
23
25
28
可以看到有很多的重復(fù)數(shù)值,這是由于重排序?qū)е率聞?wù)結(jié)束后的值不同,但是你查看counter,確實是50:
@counter => 50
證明更新是沒有問題的,問題出在commute的返回值上。
如果將next-counter修改為alter實現(xiàn):
(defn next-counter [] (dosync (alter counter inc)))
此時再執(zhí)行測試用例,可以發(fā)現(xiàn)打印結(jié)果完全正確了:
……
39
41
42
45
27
46
47
44
48
43
49
40
50
查看counter,也是正確更新到50了:
@counter => 50
最佳實踐:
通常情況下,你應(yīng)該優(yōu)先使用alter,除非在遇到明顯的性能瓶頸并且對順序不是那么關(guān)心的時候,可以考慮用commute替換。
6、validator:
類似數(shù)據(jù)庫,你也可以為Ref添加“約束”,在數(shù)據(jù)更新的時候需要通過validator函數(shù)的驗證,如果驗證不通過,整個事務(wù)將回滾。添加validator是通過ref函數(shù)傳入metadata的map實現(xiàn)的,例如我們要求歌曲集合添加的歌曲名稱不能為空:
(def validate-song
(partial every? #(not (nil? %))))
(def song (ref #{} :validator validate-song))
validate-song是一個驗證函數(shù),partial返回某個函數(shù)的半函數(shù)(固定了部分參數(shù),部分參數(shù)沒固定),你可以將partial理解成currying,雖然還是不同的。validate-song調(diào)用every?來驗證集合內(nèi)的所有元素都不是nil,其中#(not (nil? %))是一個匿名函數(shù),%指向匿名函數(shù)的第一個參數(shù),也就是集合的每個元素。ref指定了validator為validate-song,那么在每次更新song集合的時候都會將新的狀態(tài)傳入validator函數(shù)里驗證一下,如果返回false,整個事務(wù)將回滾:
(dosync (alter song conj nil))
java.lang.IllegalStateException: Invalid reference state (NO_SOURCE_FILE:0)
更新失敗,非法的reference狀態(tài),查看song果然還是空的:
@song => #{}
更新正常的值就沒有問題:
(dosync (alter song conj "dangerous")) => #{"dangerous"}
7、ensure:
ensure函數(shù)是為了保護(hù)Ref不會被其他事務(wù)所修改,它的主要目的是為了防止所謂的“
寫偏序”(
write skew)問題。寫偏序問題的產(chǎn)生跟STM的實現(xiàn)有關(guān),clojure的STM實現(xiàn)是基于
MVCC(Multiversion Concurrency Control)——多版本并發(fā)控制,對一個Ref保存多個版本的狀態(tài)值,在更新的時候取得當(dāng)前狀態(tài)值的一個隔離的snapshot,更新是基于snapshot進(jìn)行的。那么我們來看下寫偏序是怎么產(chǎn)生,以一個比喻來描述:
想象有一個系統(tǒng)用于管理美國最神秘的軍事禁區(qū)——51區(qū)的安全巡邏,你有3個營的士兵,每個營45個士兵,并且你
需要保證總體巡邏的士兵人數(shù)不能少于100個人。假設(shè)有一天,有兩個指揮官都登錄了這個管理系統(tǒng),他們都想從某個軍營里抽走20個士兵,假設(shè)指揮官A想從1號軍營抽走,指揮官B想要從2號軍營抽走士兵,他們同時執(zhí)行下列操作:
Admin 1: if ((G1 - 20) + G2 + G3) > 100 then dispatchPatrol
Admin 2: if (G1 + (G2 - 20) + G3) > 100 then dispatchPatrol
我們剛才提到,Clojure的更新是基于隔離的snapshot,一個事務(wù)的更改無法看到另一個事務(wù)更改了部分的結(jié)果,因此這兩個操作都因為滿足(45-20)+45+45=115的約束而得到執(zhí)行,導(dǎo)致實際抽調(diào)走了40個士兵,只剩下95個士兵,低于設(shè)定的安全標(biāo)準(zhǔn)100人,這就是寫偏序現(xiàn)象。
寫偏序的解決就很簡單,在執(zhí)行抽調(diào)前加入ensure即可保護(hù)ref不被其他事務(wù)所修改。ensure比(ref-set ref @ref)允許的并發(fā)程度更高一些。
Ref和STM的介紹暫時到這里,原理和源碼的解析要留待下一篇文章了。