面試官：Redis中的緩沖區了解嗎-

hello 大家好，我是七淅（xī）。

Redis 大家肯定不陌生，但在使用層面看不到的地方，就容易被忽略。今天想和大家分享的內容是 Redis 各個緩沖區的作用、溢出的後果及優化方向 。

在開始正文前，想多叨叨幾句。不管是 Redis 還是其他中間件，底層很多原理都是相似的，設計思想都是通用的。

大家以後如果在學什麽新框架/組件，可以盡量和已經學過的知識點進行聯想，這樣會更容易理解點的，不至於說死記硬背。

比如現在說到的緩沖區，它的目的是什麽呢？

無它，為了性能。

要麽緩存數據， 提高響應速度 。比如 MySQL 中有個 change buffer

要麽擔心消費者速度跟不上生產，怕 數據丟失 。所以需要把生產數據先暫存起來。Redis 的緩沖區就是這個作用。

另外，消費者速度跟不上，如果是同步處理的話，那是不是也會拖慢生產者，所以這裏其實也是在保證生產者的速度。

可能有的讀者會說：扯淡，消費者都跟不上了，生產者再快有什麽用？

其實有沒有壹種可能，生產者根本不關心消費者什麽時候用呢？前者是負責把後者需要的東西處理好給它就完事了。生產者很忙，還有其他壹大堆數據要處理，不能慢慢等消費者同步消費完才去做其他事情。

好像開頭擴展得有點多，我收壹收，下面會詳細說到。有疑問的小夥伴請上車，七淅正式發車了。

首先 Redis 有什麽緩沖區呢？

壹*** 4 個：

服務器端會給 每個連接的客戶端 都設置了壹個輸入緩沖區。

暫存請求數據。

輸入緩沖區會先把客戶端發送過來的命令暫存起來，Redis 主線程再從輸入緩沖區中讀取命令，進行處理。

為了避免客戶端和服務器端的請求發送和處理速度不匹配，這點和等下要說的輸出緩沖區是壹樣的。

首先緩沖區是壹塊固定大小的內存區域，如果要把這個地方填滿的話，那 Redis 會直接把客戶端連接關閉。

保護自己嘛，妳客戶端掛了總比我服務端掛了好，服務端壹掛就是所有客戶端都沒用了。

那填滿緩沖區就有 2 個情況了：

那麽把上述原理對應到 Redis 的場景。

壹下子填滿的情況可以是往 Redis 裏寫大量數據，百萬千萬數量級那種。

另壹個情況可以是 Redis 服務端因執行耗時操作，阻塞住了，導致沒法消費輸入緩沖區數據。

對應上面 2 個溢出場景，優化方向很自然就有了。

壹下子填滿的情況，是不是可以考慮不要壹下子寫這麽多數據，能否拆下數據（其實壹下子寫大量數據本身就不合理哈）

另外，是否可以調高緩沖區大小呢？

這個其實是不行的哈，因為沒有可以設置的地方，目前服務端默認為每個客戶端輸入緩沖區分配的大小是 1GB。

那輪到第 2 個溢出場景：兩邊處理速度不壹致。

正常來說，服務端不應該出現長時間阻塞，所以需要看看是什麽原因導致的阻塞，解決到就好了。

同輸入緩沖區，服務器端也會給 每個連接的客戶端 都設置了壹個輸出緩沖區。

同上，也是暫存請求數據。

這個地方其實我在文章開頭說的，生產者不關心消費者什麽時候用，只負責把消費者之前請求的東西處理好就完事了。

服務端壹般都會和多個客戶端連接，加上 redis 網絡通信模塊是單線程的（即使是新版本支持多線程也壹樣）

假如沒有輸出緩沖區會發生什麽事呢？

服務端處理了很多客戶端 A 的請求，需要經過網絡這壹耗時操作，返回給客戶端 A。在這個過程中，客戶端 B 的請求壹直得不到服務端處理和響應，這樣吞吐量就上不去了。

有了緩沖區之後，至少能解放服務端，讓它去處理客戶端 B 的請求。

這裏也是同輸入緩沖區，我就不啰嗦了，溢出的話服務端也會關閉客戶端連接。

類似的，不要壹下子讀大量數據；不持續在線上執行 MONITOR 命令。

而輸出緩沖區的大小是可以通過 client-output-buffer-limit 來設置的。

但是壹般來說，我們都不用改，因為默認情況就夠了，這裏了解下就好。

溫馨提示下，如果對 Redis 同步/復制不了解的讀者，比如不知道全量/增量復制，建議可以看下我這篇文章：壹文讓妳明白Redis主從同步。

下面回到正題哈。

有復制肯定有主從，而主從間的數據復制包括全量復制和增量復制兩種。

全量復制是同步所有數據，而增量復制只會把主從庫網絡斷連期間主庫收到的命令，同步給從庫。

暫存數據。

主節點上會為 每個從節點 都維護壹個復制緩沖區。

在全量復制時，主節點在向從節點傳輸 RDB 文件的同時，會繼續接收客戶端發送的寫命令請求，並保存在復制緩沖區中，等 RDB 文件傳輸完成後，再發送給從節點去執行。

從節點接收和加載 RDB 較慢，同時主節點接收到了大量的寫命令，寫命令在復制緩沖區中就會越積越多，最後就會溢出。

壹旦溢出，主節點會直接關閉和從節點進行復制操作的連接，導致全量復制失敗

可以控制主節點數據量在 2~4GB（僅供參考），這樣可以讓全量同步執行得更快些，避免復制緩沖區累積過多命令

也可以調整緩沖區大小，還是之前的 client-output-buffer-limit 參數。

比如： config set client-output-buffer-limit slave 512mb 128mb 60

這個是在新增復制用到的緩沖區。

暫存數據。

從節點意外斷開連接後重連，可從該緩沖區同步期間沒同步到的數據。

不會溢出。（想不到吧.jpg）

該緩沖區本質是壹個 固定長度，先進先出的隊列 ，默認 1MB。

所以當隊列被占滿，不是報錯，也不像上面幾個緩沖區直接關閉連接。而是覆蓋最早進入隊列的數據。

因此，如果有從節點還沒有同步這些舊命令數據，就會導致主從節點重新進行全量復制，而不是增量復制。

調整復制積壓緩沖區的大小，參數是： repl_backlog_size

上一篇:python基礎:數據分析常用包

下一篇:中國首枚NFV芯片郵票，NFV技術是壹種什麽技術？

什麽是膜厚，什麽是膜厚測試，什麽是鹽霧，鹽霧測試是什麽樣的？有人知道嗎？

關於黃河，母親河的壹些資料，我要的不是詩!