一、前言
前面已經(jīng)講解了Zookeeper的一些應(yīng)用場(chǎng)景,但是并沒(méi)有深入到Zookeeper內(nèi)部進(jìn)行分析,本篇將講解其系統(tǒng)模型。
二、系統(tǒng)模型
2.1 數(shù)據(jù)模型
Zookeeper的數(shù)據(jù)節(jié)點(diǎn)稱為ZNode,ZNode是Zookeeper中數(shù)據(jù)的最小單元,每個(gè)ZNode都可以保存數(shù)據(jù),同時(shí)還可以掛載子節(jié)點(diǎn),因此構(gòu)成了一個(gè)層次化的命名空間,稱為樹。

在Zookeeper中,事務(wù)是指能夠改變Zookeeper服務(wù)器狀態(tài)的操作,一般包括節(jié)點(diǎn)創(chuàng)建與刪除,數(shù)據(jù)節(jié)點(diǎn)內(nèi)容更新和客戶端會(huì)話創(chuàng)建與失效,對(duì)于每個(gè)事務(wù)請(qǐng)求,Zookeeper都會(huì)為其分配一個(gè)全局唯一的事務(wù)ID,用ZXID表示,通常是64位的數(shù)字,每個(gè)ZXID對(duì)應(yīng)一次更新操作,從這些ZXID中可以間接地識(shí)別出Zookeeper處理這些更新操作請(qǐng)求的全局順序。
2.2 節(jié)點(diǎn)特性
在Zookeeper中,每個(gè)數(shù)據(jù)節(jié)點(diǎn)都是由生命周期的,類型不同則會(huì)不同的生命周期,節(jié)點(diǎn)類型可以分為持久節(jié)點(diǎn)(PERSISTENT)、臨時(shí)節(jié)點(diǎn)(EPHEMERAL)、順序節(jié)點(diǎn)(SEQUENTIAL)三大類,可以通過(guò)組合生成如下四種類型節(jié)點(diǎn)
1. 持久節(jié)點(diǎn)(PERSISTENT)。節(jié)點(diǎn)創(chuàng)建后便一直存在于Zookeeper服務(wù)器上,直到有刪除操作來(lái)主動(dòng)清楚該節(jié)點(diǎn)。
2. 持久順序節(jié)點(diǎn)(PERSISTENT_SEQUENTIAL)。相比持久節(jié)點(diǎn),其新增了順序特性,每個(gè)父節(jié)點(diǎn)都會(huì)為它的第一級(jí)子節(jié)點(diǎn)維護(hù)一份順序,用于記錄每個(gè)子節(jié)點(diǎn)創(chuàng)建的先后順序。在創(chuàng)建節(jié)點(diǎn)時(shí),會(huì)自動(dòng)添加一個(gè)數(shù)字后綴,作為新的節(jié)點(diǎn)名,該數(shù)字后綴的上限是整形的最大值。
3. 臨時(shí)節(jié)點(diǎn)(EPEMERAL)。臨時(shí)節(jié)點(diǎn)的生命周期與客戶端會(huì)話綁定,客戶端失效,節(jié)點(diǎn)會(huì)被自動(dòng)清理。同時(shí),Zookeeper規(guī)定不能基于臨時(shí)節(jié)點(diǎn)來(lái)創(chuàng)建子節(jié)點(diǎn),即臨時(shí)節(jié)點(diǎn)只能作為葉子節(jié)點(diǎn)。
4. 臨時(shí)順序節(jié)點(diǎn)(EPEMERAL_SEQUENTIAL)。在臨時(shí)節(jié)點(diǎn)的基礎(chǔ)添加了順序特性。
每個(gè)節(jié)點(diǎn)除了存儲(chǔ)數(shù)據(jù)外,還存儲(chǔ)了節(jié)點(diǎn)本身的一些狀態(tài)信息,可通過(guò)get命令獲取。
2.3 版本--保證分布式數(shù)據(jù)原子性操作
每個(gè)數(shù)據(jù)節(jié)點(diǎn)都具有三種類型的版本信息,對(duì)數(shù)據(jù)節(jié)點(diǎn)的任何更新操作都會(huì)引起版本號(hào)的變化。
version-- 當(dāng)前數(shù)據(jù)節(jié)點(diǎn)數(shù)據(jù)內(nèi)容的版本號(hào)
cversion-- 當(dāng)前數(shù)據(jù)子節(jié)點(diǎn)的版本號(hào)
aversion-- 當(dāng)前數(shù)據(jù)節(jié)點(diǎn)ACL變更版本號(hào)
上述各版本號(hào)都是表示修改次數(shù),如version為1表示對(duì)數(shù)據(jù)節(jié)點(diǎn)的內(nèi)容變更了一次。即使前后兩次變更并沒(méi)有改變數(shù)據(jù)內(nèi)容,version的值仍然會(huì)改變。version可以用于寫入驗(yàn)證,類似于CAS。
2.4 Watcher--數(shù)據(jù)變更通知
Zookeeper使用Watcher機(jī)制實(shí)現(xiàn)分布式數(shù)據(jù)的發(fā)布/訂閱功能。

Zookeeper的Watcher機(jī)制主要包括客戶端線程、客戶端WatcherManager、Zookeeper服務(wù)器三部分。客戶端在向Zookeeper服務(wù)器注冊(cè)的同時(shí),會(huì)將Watcher對(duì)象存儲(chǔ)在客戶端的WatcherManager當(dāng)中。當(dāng)Zookeeper服務(wù)器觸發(fā)Watcher事件后,會(huì)向客戶端發(fā)送通知,客戶端線程從WatcherManager中取出對(duì)應(yīng)的Watcher對(duì)象來(lái)執(zhí)行回調(diào)邏輯。
2.5 ACL--保障數(shù)據(jù)的安全
Zookeeper內(nèi)部存儲(chǔ)了分布式系統(tǒng)運(yùn)行時(shí)狀態(tài)的元數(shù)據(jù),這些元數(shù)據(jù)會(huì)直接影響基于Zookeeper進(jìn)行構(gòu)造的分布式系統(tǒng)的運(yùn)行狀態(tài),如何保障系統(tǒng)中數(shù)據(jù)的安全,從而避免因誤操作而帶來(lái)的數(shù)據(jù)隨意變更而導(dǎo)致的數(shù)據(jù)庫(kù)異常十分重要,Zookeeper提供了一套完善的ACL權(quán)限控制機(jī)制來(lái)保障數(shù)據(jù)的安全。
我們可以從三個(gè)方面來(lái)理解ACL機(jī)制:權(quán)限模式(Scheme)、授權(quán)對(duì)象(ID)、權(quán)限(Permission),通常使用"scheme:id:permission"來(lái)標(biāo)識(shí)一個(gè)有效的ACL信息。
權(quán)限模式用來(lái)確定權(quán)限驗(yàn)證過(guò)程中使用的檢驗(yàn)策略,有如下四種模式:
1. IP,通過(guò)IP地址粒度來(lái)進(jìn)行權(quán)限控制,如"ip:192.168.0.110"表示權(quán)限控制針對(duì)該IP地址,同時(shí)IP模式可以支持按照網(wǎng)段方式進(jìn)行配置,如"ip:192.168.0.1/24"表示針對(duì)192.168.0.*這個(gè)網(wǎng)段進(jìn)行權(quán)限控制。
2. Digest,使用"username:password"形式的權(quán)限標(biāo)識(shí)來(lái)進(jìn)行權(quán)限配置,便于區(qū)分不同應(yīng)用來(lái)進(jìn)行權(quán)限控制。Zookeeper會(huì)對(duì)其進(jìn)行SHA-1加密和BASE64編碼。
3. World,最為開放的權(quán)限控制模式,數(shù)據(jù)節(jié)點(diǎn)的訪問(wèn)權(quán)限對(duì)所有用戶開放。
4. Super,超級(jí)用戶,是一種特殊的Digest模式,超級(jí)用戶可以對(duì)任意Zookeeper上的數(shù)據(jù)節(jié)點(diǎn)進(jìn)行任何操作。
授權(quán)對(duì)象是指權(quán)限賦予的用戶或一個(gè)指定實(shí)體,如IP地址或機(jī)器等。不同的權(quán)限模式通常有不同的授權(quán)對(duì)象。
權(quán)限是指通過(guò)權(quán)限檢查可以被允許執(zhí)行的操作,Zookeeper對(duì)所有數(shù)據(jù)的操作權(quán)限分為CREATE(節(jié)點(diǎn)創(chuàng)建權(quán)限)、DELETE(節(jié)點(diǎn)刪除權(quán)限)、READ(節(jié)點(diǎn)讀取權(quán)限)、WRITE(節(jié)點(diǎn)更新權(quán)限)、ADMIN(節(jié)點(diǎn)管理權(quán)限)。
三、總結(jié)
本篇博客介紹了Zookeeper中的系統(tǒng)模型,系統(tǒng)模型的五個(gè)部分是Zookeeper提供一系列服務(wù)的基礎(chǔ),之后筆者會(huì)結(jié)合源碼進(jìn)行相應(yīng)分析。謝謝各位園友觀看~