轉載自: http://hi.baidu.com/fdwm_lx/blog/item/fe46344e11517705b3de054c.html
在大型web應用中,緩存可算是當今的一個標準開發配置了。在大 規模的緩存應用中,應運而生了分布式緩存系統。分布式緩存系統的基本原理,大家也有所耳聞。key-value如何均勻的分散到集群中?說到此,最常規的 方式莫過于hash取模的方式。比如集群中可用機器適量為N,那么key值為K的的數據請求很簡單的應該路由到hash(K) mod N對應的機器。的確,這種結構是簡單的,也是實用的。但是在一些高速發展的web系統中,這樣的解決方案仍有些缺陷。隨著系統訪問壓力的增長,緩存系統不 得不通過增加機器節點的方式提高集群的相應速度和數據承載量。增加機器意味著按照hash取模的方式,在增加機器節點的這一時刻,大量的緩存命不中,緩存 數據需要重新建立,甚至是進行整體的緩存數據遷移,瞬間會給DB帶來極高的系統負載,設置導致DB服務器宕機。 那么就沒有辦法解決hash取模的方式帶來的詬病嗎?看下文。
一致性哈希(Consistent Hashing):
????? 選擇具體的機器節點不在只依賴需要緩存數據的key的hash本身了,而是機器節點本身也進行了hash運算。
(1) hash機器節點
首先求出 機器節點的hash值(怎么算機器節點的hash?ip可以作為hash的參數吧。。當然還有其他的方法了),然后將其分布到0~2^32的一個圓環上 (順時針分布)。如下圖所示:
集群中有 機器:A , B, C, D, E五臺機器,通過一定的hash算法我們將其分布到如上圖所示的環上。
(2)訪問方式
如果有一 個寫入緩存的請求,其中Key值為K,計算器hash值Hash(K), Hash(K) 對應于圖 – 1環中的某一個點,如果該點對應沒有映射到具體的某一個機器節點,那么順時針查找,直到第一次找到有映射機器的節點,該節點就是確定的目標節點,如果超過 了2^32仍然找不到節點,則命中第一個機器節點。比如 Hash(K) 的值介于A~B之間,那么命中的機器節點應該是B節點(如上圖 )。
(3)增加節點的處理
如上圖 – 1,在原有集群的基礎上欲增加一臺機器F,增加過程如下:
計算機器 節點的Hash值,將機器映射到環中的一個節點,如下圖:
增加機器 節點F之后,訪問策略不改變,依然按照(2)中的方式訪問,此時緩存命不中的情況依然不可避免,不能命中的數據是hash(K)在增加節點以前落在C~F 之間的數據。盡管依然存在節點增加帶來的命中問題,但是比較傳統的 hash取模的方式,一致性hash已經將不命中的數據降到了最低。
?
Consistent Hashing最大限度地抑制了hash鍵的重新分布。另外要取得比較好的負載均衡的效果,往往在服務器數量比較少的時候需要增加虛擬節點來保證服務器能 均勻的分布在圓環上。因為使用一般的hash方法,服務器的映射地點的分布非常不均勻。使用虛擬節點的思想,為每個物理節點(服務器)在圓上分配 100~200個點。這樣就能抑制分布不均勻,最大限度地減小服務器增減時的緩存重新分布。用戶數據映射在虛擬節點上,就表示用戶數據真正存儲位置是在該 虛擬節點代表的實際物理服務器上。
下面有一個圖描述了需要為每臺物理服務器增加的虛擬節點。
x軸表示的是需要為每臺物理服務器擴展的虛擬節點倍數(scale),y軸是實際物理服務器數,可以看出,當物理服務器的數量很小時,需要更大的虛 擬節點,反之則需要更少的節點,從圖上可以看出,在物理服務器有10臺時,差不多需要為每臺服務器增加100~200個虛擬節點才能達到真正的負載均衡。
-----------------
一致性hash,假設本來應該落在B點的數據,在A,B之間加一臺機器,平均有一半的數據會無效。并且A到加的機器點上的數據在B上已經沒有用,怎么去清 理。隨著機器的越來越多,不命中的概率也會越來越多。
雖然說最常用的hash取模不可避免的需要做數據遷移,但是可以選擇時間點,比如半夜兩點。這個時候訪問肯定會很少。?
--
如果是C、A之間加入節點B,那原來落在CB之間的數據不再找A,而是找B了,這部分數據在A確實是失效。但你說的這個是純理論。實際中加入B節點之 后,CB間的數據(原來命中A上)會逐漸保存到B上(而不是不命中的時候什么都不做),同時A上的數據隨著新到數據增加,原來那部分失效數據通過LRU算 法將逐漸淘汰掉。所以我覺隨著機器增加,不命中的概率不會大幅波動。
事實上,一致性hash就是用來解決存儲節點增加導致的命中降低問題的。
實際例子:日本mixi也是逐漸增加到200臺以上的memcached服務器集群,用的就是這種方法,并沒有你說的問題。
更多文章、技術交流、商務合作、聯系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
