同樣類似的參數(shù)還有:
list-max-ziplist-entries 512
說(shuō)明:list 數(shù)據(jù)類型多少節(jié)點(diǎn)以下會(huì)采用去指針的緊湊存儲(chǔ)格式。
list-max-ziplist-value 64
說(shuō)明:list 數(shù)據(jù)類型節(jié)點(diǎn)值大小小于多少字節(jié)會(huì)采用緊湊存儲(chǔ)格式。
set-max-intset-entries 512
說(shuō)明:set 數(shù)據(jù)類型內(nèi)部數(shù)據(jù)如果全部是數(shù)值型,且包含多少節(jié)點(diǎn)以下會(huì)采用緊湊格式存儲(chǔ)。
最后想說(shuō)的是 Redis 內(nèi)部實(shí)現(xiàn)沒(méi)有對(duì)內(nèi)存分配方面做過(guò)多的優(yōu)化,在一定程度上會(huì)存在內(nèi)存碎片,不過(guò)大多數(shù)情況下這個(gè)不會(huì)成為 Redis 的性能瓶 頸,不過(guò)如果在 Redis 內(nèi)部存儲(chǔ)的大部分?jǐn)?shù)據(jù)是數(shù)值型的話,Redis 內(nèi)部采用了一個(gè) shared integer 的方式來(lái)省去分配內(nèi)存的開(kāi)銷,即在系統(tǒng)啟動(dòng)時(shí)先分配一個(gè)從 1~n 那么多個(gè)數(shù)值對(duì)象放在一個(gè)池子中,如果存儲(chǔ)的數(shù)據(jù)恰好是這個(gè)數(shù)值范圍內(nèi)的數(shù)據(jù),則直接從池子里取出該對(duì)象,并且通過(guò)引用計(jì)數(shù)的方式來(lái)共享,這樣在系統(tǒng)存儲(chǔ)了大量數(shù)值下,也能一定程度上節(jié)省內(nèi)存并且提高性能,這個(gè)參數(shù)值 n 的設(shè)置需要修改源代碼中的一行宏定義 REDIS_SHARED_INTEGERS,該值 默認(rèn)是 10000,可以根據(jù)自己的需要進(jìn)行修改,修改后重新編譯就可以了。
Redis 的持久化機(jī)制
Redis 由于支持非常豐富的內(nèi)存數(shù)據(jù)結(jié)構(gòu)類型,如何把這些復(fù)雜的內(nèi)存組織方式持久化到磁盤上是一個(gè)難題,所以 Redis 的持久化方式與傳統(tǒng)數(shù)據(jù)庫(kù)的方式有比較多的差別,Redis 一共支持四種持久化方式,分別是:
– 定時(shí)快照方式(snapshot)
– 基于語(yǔ)句追加文件的方式(aof)
– 虛擬內(nèi)存(vm)
– Diskstore 方式
在設(shè)計(jì)思路上,前兩種是基于全部數(shù)據(jù)都在內(nèi)存中,即小數(shù)據(jù)量下提供磁盤落地功能,而后兩種方式則是作者在嘗試存儲(chǔ)數(shù)據(jù)超過(guò)物理內(nèi)存時(shí),即大數(shù)據(jù)量的數(shù)據(jù)存儲(chǔ),截止到本文,后兩種持久化方式仍然是在實(shí)驗(yàn)階段,并且 vm 方式基本已經(jīng)被作者放棄,所以實(shí)際能在生產(chǎn)環(huán)境用的只有前兩種,換句話說(shuō) Redis 目前還只能作為小數(shù)據(jù)量存儲(chǔ)(全部數(shù)據(jù)能夠加載在內(nèi)存中),海量數(shù)據(jù)存儲(chǔ)方面并不是 Redis 所擅長(zhǎng)的領(lǐng)域。下面分別介紹下這幾種持久化方式:
定時(shí)快照方式(snapshot):
該持久化方式實(shí)際是在 Redis 內(nèi)部一個(gè)定時(shí)器事件,每隔固定時(shí)間去檢查當(dāng)前數(shù)據(jù)發(fā)生的改變次數(shù)與時(shí)間是否滿足配置的持久化觸發(fā)的條件,如果滿足則通過(guò)操作系統(tǒng) fork 調(diào)用來(lái)創(chuàng)建出一個(gè)子進(jìn)程,這個(gè)子進(jìn)程默認(rèn)會(huì)與父進(jìn)程共享相同的地址空間,這時(shí)就可以通過(guò)子進(jìn)程來(lái)遍歷整個(gè)內(nèi)存來(lái)進(jìn)行存儲(chǔ)操作,而主進(jìn)程則仍然可以提供服務(wù),當(dāng)有寫入時(shí)由操作系統(tǒng)按照內(nèi)存頁(yè)(page)為單位來(lái)進(jìn)行 copy-on-write 保證父子進(jìn)程之間不會(huì)互相影響。
該持久化的主要缺點(diǎn)是定時(shí)快照只是代表一段時(shí)間內(nèi)的內(nèi)存映像,所以系統(tǒng)重啟會(huì)丟失上次快照與重啟之間所有的數(shù)據(jù)。
基于語(yǔ)句追加方式(aof):
aof 方式實(shí)際類似 mysql 基于語(yǔ)句的 binlog 方式,即每條會(huì)使 Redis 內(nèi)存數(shù)據(jù)發(fā)生改變的命令都會(huì)追加到一個(gè) log 文件中,也就是說(shuō)這個(gè) log 文件就是 Redis 的持久化數(shù)據(jù)。
aof 的方式的主要缺點(diǎn)是追加 log 文件可能導(dǎo)致體積過(guò)大,當(dāng)系統(tǒng)重啟恢復(fù)數(shù)據(jù)時(shí)如果是 aof 的方式則加載數(shù)據(jù)會(huì)非常慢,幾十G的數(shù)據(jù)可能需要幾小時(shí)才能加載完,當(dāng)然這個(gè)耗時(shí)并不是因?yàn)榇疟P文件讀取速度慢,而是由于讀取的所有命令都要在內(nèi)存中執(zhí)行一遍。另外由于每條命令都要寫 log,所以使用 aof 的方式,Redis 的讀寫性能也會(huì)有所下降。
虛擬內(nèi)存方式:
虛擬內(nèi)存方式是 Redis 來(lái)進(jìn)行用戶空間的數(shù)據(jù)換入換出的一個(gè)策略,此種方式在實(shí)現(xiàn)的效果上比較差,主要問(wèn)題是代碼復(fù)雜,重啟慢,復(fù)制慢等等,目前已經(jīng)被作者放棄。
diskstore 方式:
diskstore 方式是作者放棄了虛擬內(nèi)存方式后選擇的一種新的實(shí)現(xiàn)方式,也就是傳統(tǒng)的 B-tree 的方式,目前仍在實(shí)驗(yàn)階段,后續(xù)是否可用我們可以拭目以待。
Redis 持久化磁盤 IO 方式及其帶來(lái)的問(wèn)題
有 Redis 線上運(yùn)維經(jīng)驗(yàn)的人會(huì)發(fā)現(xiàn) Redis 在物理內(nèi)存使用比較多,但還沒(méi)有超過(guò)實(shí)際物理內(nèi)存總?cè)萘繒r(shí)就會(huì)發(fā)生不穩(wěn)定甚至崩潰的問(wèn)題,有人認(rèn)為是基于快照方式持久化的 fork 系統(tǒng)調(diào)用造成內(nèi)存占用加倍而導(dǎo)致的,這種觀點(diǎn)是不準(zhǔn)確的,因?yàn)?fork 調(diào)用的 copy-on-write 機(jī)制是基于操作系統(tǒng)頁(yè)這個(gè)單位的,也就是只有有寫入的臟頁(yè)會(huì)被復(fù)制,但是一般你的系統(tǒng)不會(huì)在短時(shí)間內(nèi)所有的頁(yè)都發(fā)生了寫入而導(dǎo)致復(fù)制,那么是什么原因?qū)е?Redis 崩潰的呢?