zookeeper

計算機系統

ZooKeeper是一個分散式的,開放源碼的分散式應用程序協調服務,是google的Chubby一個開源的實現,是Hadoop和Hbase的重要組件。它是一個為分散式應用提供一致性服務的軟體,提供的功能包括:配置維護、域名服務、分散式同步、組服務等。

ZooKeeper的目標就是封裝好複雜易出錯的關鍵服務,將簡單易用的介面和性能高效、功能穩定的系統提供給用戶。

ZooKeeper包含一個簡單的原語集,提供Java和C的介面。

ZooKeeper代碼版本中,提供了分散式獨享鎖、選舉、隊列的介面,代碼在zookeeper-3.4.3\src\recipes。其中分佈鎖和隊列有Java和C兩個版本,選舉只有Java版本。

原理


ZooKeeper是以Fast Paxos演演算法為基礎的,Paxos 演演算法存在活鎖的問題,即當有多個proposer交錯提交時,有可能互相排斥導致沒有一個proposer能提交成功,而Fast Paxos作了一些優化,通過選舉產生一個leader (領導者),只有leader才能提交proposer,具體演演算法可見Fast Paxos。因此,要想弄懂ZooKeeper首先得對Fast Paxos有所了解。
ZooKeeper的基本運轉流程:
1、選舉Leader。
2、同步數據。
3、選舉Leader過程中演演算法有很多,但要達到的選舉標準是一致的。
4、Leader要具有最高的執行ID,類似root許可權。
5、集群中大多數的機器得到響應並接受選出的Leader。

特點


在Zookeeper中,znode是一個跟Unix文件系統路徑相似的節點,可以往這個節點存儲或獲取數據。如果在創建znode時Flag設置為EPHEMERAL,那麼當創建這個znode的節點和Zookeeper失去連接后,這個znode將不再存在在Zookeeper里,Zookeeper使用Watcher察覺事件信息。當客戶端接收到事件信息,比如連接超時、節點數據改變、子節點改變,可以調用相應的行為來處理數據。Zookeeper的Wiki頁面展示了如何使用Zookeeper來處理事件通知,隊列,優先隊列,鎖,共享鎖,可撤銷的共享鎖,兩階段提交。
那麼Zookeeper能做什麼事情呢,簡單的例子:假設我們有20個搜索引擎的伺服器(每個負責總索引中的一部分的搜索任務)和一個總伺服器(負責向這20個搜索引擎的伺服器發出搜索請求併合並結果集),一個備用的總伺服器(負責當總伺服器宕機時替換總伺服器),一個web的cgi(向總伺服器發出搜索請求)。搜索引擎的伺服器中的15個伺服器提供搜索服務,5個伺服器正在生成索引。這20個搜索引擎的伺服器經常要讓正在提供搜索服務的伺服器停止提供服務開始生成索引,或生成索引的伺服器已經把索引生成完成可以提供搜索服務了。使用Zookeeper可以保證總伺服器自動感知有多少提供搜索引擎的伺服器並向這些伺服器發出搜索請求,當總伺服器宕機時自動啟用備用的總伺服器。

客戶端


PHP
註:以下代碼依賴於PHP擴展libzookeeper 。
連接集群:
創建節點:
刪除節點:
獲取節點值:
獲取子節點:

其他


HBase和ZooKeeper
HBase內置有ZooKeeper,也可以使用外部ZooKeeper。
讓HBase使用一個已有的不被HBase託管的Zookeep集群,需要設置 conf/hbase env sh文件中的HBASE_MANAGES_ZK 屬性為 false
... # Tell HBase whether it should manage it's own instance of Zookeeper or not. export HBASE_MANAGES_ZK=false
接下來,指明Zookeeper的host和埠。可以在 hbase-site.xml中設置, 也可以在HBase的CLASSPATH下面加一個zoo.cfg配置文件。 HBase 會優先載入 zoo.cfg 裡面的配置,把hbase-site.xml裡面的覆蓋掉.
當HBase託管ZooKeeper的時候,Zookeeper集群的啟動是HBase啟動腳本的一部分。但你需要自己去運行。你可以這樣做
${HBASE_HOME}/bin/hbase-daemons sh {start,stop} zookeeper
你可以用這條命令啟動ZooKeeper而不啟動HBase. HBASE_MANAGES_ZK 的值是 false,如果你想在HBase重啟的時候不重啟ZooKeeper,你可以這樣做
對於獨立Zoopkeeper的問題,你可以在 Zookeeper啟動得到幫助.