自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

僅需這一篇，妥妥的吃透”負載均衡”

作者：張帆（Zachary） 2018-10-16 09:43:26

開發(fā) 架構(gòu) 開發(fā)工具

本文作者將通過圖文并茂的方式，來描述出每一種負載均衡策略的完整樣貌。

我們都對高可用有一個基本的認識，其中負載均衡是高可用的核心工作。本文將通過如下幾個方面，讓你妥妥的吃透“負載均衡”。

負載均衡是什么
常用負載均衡策略圖解
常用負載均衡策略優(yōu)缺點和適用場景
用健康探測來保障高可用
結(jié)語

負載均衡是什么

正如上圖所示的這樣，由一個獨立的統(tǒng)一入口來收斂流量，再做二次分發(fā)的過程就是負載均衡，它的本質(zhì)和分布式系統(tǒng)一樣，是分治。

如果大家習慣了開車的時候用一些導航軟件，我們會發(fā)現(xiàn)，導航軟件的推薦路線方案會有一個數(shù)量的上限，比如 3 條、5 條。

因此，其實本質(zhì)上它也起到了一個類似負載均衡的作用，因為如果只能取 Top3 的通暢路線，自然擁堵嚴重的路線就無法推薦給你了，使得車流的壓力被分攤到了相對空閑的路線上。

在軟件系統(tǒng)中也是一樣的道理，為了避免流量分攤不均，造成局部節(jié)點負載過大(如 CPU 吃緊等)，所以引入一個獨立的統(tǒng)一入口來做類似上面的“導航”的工作。

但是，軟件系統(tǒng)中的負載均衡與導航的不同在于：導航是一個柔性策略，最終還是需要使用者做選擇，而前者則不同。

怎么均衡的背后是策略在起作用，而策略的背后是由某些算法或者說邏輯來組成的。

比如，導航中的算法屬于路徑規(guī)劃范疇，在這個范疇內(nèi)又細分為靜態(tài)路徑規(guī)劃和動態(tài)路徑規(guī)劃，并且，在不同的分支下還有各種具體計算的算法實現(xiàn)，如 Dijikstra、A* 等。

同樣的，在軟件系統(tǒng)中的負載均衡，也有很多算法或者說邏輯在支撐著這些策略，巧的是也有靜態(tài)和動態(tài)之分。

常用負載均衡策略圖解

下面來羅列一下日常工作中最常見的 5 種策略。

輪詢

這是最常用也最簡單策略，平均分配，人人都有、一人一次。大致的代碼如下：

int  globalIndex = 0;   //注意是全局變量，不是局部變量。 
 
try 
{ 
 
    return servers[globalIndex]; 
} 
finally 
{ 
    globalIndex++; 
    if (globalIndex == 3) 
        globalIndex = 0; 
}

加權(quán)輪詢

在輪詢的基礎(chǔ)上，增加了一個權(quán)重的概念。權(quán)重是一個泛化后的概念，可以用任意方式來體現(xiàn)，本質(zhì)上是一個能者多勞思想。

比如，可以根據(jù)宿主的性能差異配置不同的權(quán)重。大致的代碼如下：

int matchedIndex = -1; 
int total = 0; 
 
for (int i = 0; i < servers.Length; i++) 
{ 
      servers[i].cur_weight += servers[i].weight;//①每次循環(huán)的時候做自增（步長=權(quán)重值） 
      total += servers[i].weight;//②將每個節(jié)點的權(quán)重值累加到匯總值中 
      if (matchedIndex == -1 || servers[matchedIndex].cur_weight < servers[i].cur_weight) //③如果 當前節(jié)點的自增數(shù) > 當前待返回節(jié)點的自增數(shù)，則覆蓋。 
      { 
            matchedIndex = i; 
      } 
} 
 
servers[matchedIndex].cur_weight -= total;//④被選取的節(jié)點減去②的匯總值，以降低下一次被選舉時的初始權(quán)重值。 
return servers[matchedIndex];

這段代碼的過程如下圖的表格。"()"中的數(shù)字就是自增數(shù)，即代碼中的 cur_weight。

值得注意的是，加權(quán)輪詢本身還有不同的實現(xiàn)方式，雖說最終的比例都是 2：1：2。

但是在請求送達的先后順序上可以有所不同。比如「5-4，3，2-1」和上面的案例相比，最終比例是一樣的，但是效果不同。

「5-4，3，2-1」更容易產(chǎn)生并發(fā)問題，導致服務(wù)端擁塞，且這個問題隨著權(quán)重數(shù)字越大越嚴重。

例子：10：5：3 的結(jié)果是「18-17-16-15-14-13-12-11-10-9，8-7-6-5-4，3-2-1」

最少連接數(shù)

這是一種根據(jù)實時的負載情況，進行動態(tài)負載均衡的方式。維護好活動中的連接數(shù)量，然后取最小的返回即可。大致的代碼如下：

var matchedServer = servers.orderBy(e => e.active_conns).first(); 
 
matchedServer.active_conns += 1; 
 
return matchedServer; 
 
//在連接關(guān)閉時還需對active_conns做減1的動作。

最快響應

這也是一種動態(tài)負載均衡策略，它的本質(zhì)是根據(jù)每個節(jié)點對過去一段時間內(nèi)的響應情況來分配，響應越快分配的越多。

具體的運作方式也有很多，上圖的這種可以理解為，將最近一段時間的請求耗時的平均值記錄下來，結(jié)合前面的加權(quán)輪詢來處理，所以等價于 2：1：3 的加權(quán)輪詢。

題外話：一般來說，同機房下的延遲基本沒什么差異，響應時間的差異主要在服務(wù)的處理能力上。

如果在跨地域(例：浙江->上海，還是浙江->北京)的一些請求處理中運用，大多數(shù)情況會使用定時「Ping」的方式來獲取延遲情況，因為是 OSI 的 L3 轉(zhuǎn)發(fā)，數(shù)據(jù)更干凈，準確性更高。

Hash 法

Hash 法的負載均衡與之前的幾種不同在于，它的結(jié)果是由客戶端決定的。通過客戶端帶來的某個標識經(jīng)過一個標準化的散列函數(shù)進行打散分攤。上圖中的散列函數(shù)運用的是最簡單粗暴的取余法。

題外話：散列函數(shù)除了取余之外，還有諸如變基、折疊、平方取中法等等，此處不做展開，有興趣的小伙伴可自行查閱資料。

另外，被求余的參數(shù)其實可以是任意的，只要最終轉(zhuǎn)化成一個整數(shù)參與運算即可。

最常用的應該是用來源 IP 地址作為參數(shù)，這樣可以確保相同的客戶端請求盡可能落在同一臺服務(wù)器上。

常用負載均衡策略優(yōu)缺點和適用場景

我們知道，沒有完美的事物，負載均衡策略也是一樣。上面列舉的這些最常用的策略也有各自的優(yōu)缺點和適用場景，我稍作了整理，如下。

這些負載均衡算法之所以常用也是因為簡單，想要更優(yōu)的效果，必然就需要更高的復雜度。

比如，可以將簡單的策略組合使用、或者通過更多維度的數(shù)據(jù)采樣來綜合評估、甚至是基于進行數(shù)據(jù)挖掘后的預測算法來做。

用健康探測來保障高可用

不管是什么樣的策略，難免會遇到機器故障或者程序故障的情況。所以要確保負載均衡能更好的起到效果，還需要結(jié)合一些健康探測機制。定時的去探測服務(wù)端是不是還能連上，響應是不是超出預期的慢。

如果節(jié)點屬于“不可用”的狀態(tài)的話，需要將這個節(jié)點臨時從待選取列表中移除，以提高可用性。一般常用的健康探測方式有 3 種。

HTTP 探測

使用 Get/Post 的方式請求服務(wù)端的某個固定的 URL，判斷返回的內(nèi)容是否符合預期。一般使用 HTTP 狀態(tài)碼、Response 中的內(nèi)容來判斷。

TCP 探測

基于 TCP 的三次握手機制來探測指定的 IP + 端口。最佳實踐可以借鑒阿里云的 SLB 機制，如下圖：

▲圖片來源于阿里云，版權(quán)歸原作者所有

值得注意的是，為了盡早釋放連接，在三次握手結(jié)束后立馬跟上 RST 來中斷 TCP 連接。

UDP 探測

可能有部分應用使用的是 UDP 協(xié)議。在此協(xié)議下可以通過報文來進行探測指定的 IP + 端口。最佳實踐同樣可以借鑒阿里云的 SLB 機制，如下圖：

▲圖片來源于阿里云，版權(quán)歸原作者所有

結(jié)果的判定方式是：在服務(wù)端沒有返回任何信息的情況下，默認是正常狀態(tài)。否則會返回一個 ICMP 的報錯信息。

結(jié)語

用一句話來概括負載均衡的本質(zhì)是：將請求或者說流量，以期望的規(guī)則分攤到多個操作單元上進行執(zhí)行。

通過它可以實現(xiàn)橫向擴展(scale out)，將冗余的作用發(fā)揮為高可用。另外，還可以物盡其用，提升資源使用率。

責任編輯：武曉燕來源：跨界架構(gòu)師

負載均衡 TCP HTTP

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營