Redis類型(Type)與編碼(Encoding)
Redis是一款開源的高性能key-value數(shù)據(jù)庫(kù),廣泛應(yīng)用于各種場(chǎng)景。在Redis中, 數(shù)據(jù)類型(Type)和編碼(Encoding) 是非常重要的概念。本篇博客將詳細(xì)介紹Redis支持的數(shù)據(jù)類型以及相應(yīng)的編碼方式和底層實(shí)現(xiàn)原理。
要查看Redis某個(gè)key的內(nèi)部編碼,可以使用Redis自帶的命令OBJECT ENCODING key。
其中,key是你想要查詢的鍵名。例如,如果你想要查詢名為mykey的鍵的內(nèi)部編碼,可以執(zhí)行以下命令:
127.0.0.1:6379> object encoding mykey // 查看某個(gè)Redis鍵值的編碼
一 、redisObject
在Redis中,redisObject 是一個(gè)非常重要的數(shù)據(jù)結(jié)構(gòu),它用于保存字符串、列表、集合、哈希表和有序集合等類型的值。以下是關(guān)于 redisObject 結(jié)構(gòu)體的定義:
typedef struct redisObject {
unsigned type:4;
unsigned encoding:4;
unsigned lru:24; /* lru time (relative to server.lruclock) */
int refcount;
void *ptr;
} robj;
各個(gè)屬性解析如下:
- type:用于標(biāo)識(shí)對(duì)象所屬的類型,分別是 REDIS_STRING、REDIS_LIST、REDIS_SET、REDIS_ZSET 和 REDIS_HASH 等。
- encoding: 用于標(biāo)識(shí)對(duì)象內(nèi)部的編碼方式, 如 REDIS_ENCODING_INT、REDIS_ENCODING_HT、REDIS_ENCODING_ZIPMAP 等。
- lru:這個(gè)字段記錄了對(duì)象被命令調(diào)用的時(shí)間, 它是緩存淘汰策略(LRU)的一部分。
- refcount:引用計(jì)數(shù),當(dāng) refcount 減少到0時(shí),對(duì)象就可以被清理并回收內(nèi)存。
- ptr:一個(gè)指針,根據(jù)對(duì)象的類型和編碼方式的不同,這個(gè)指針可能會(huì)指向各種不同的類型,比如整數(shù)、動(dòng)態(tài)字符串、鏈表、字典等。
其中,redisObject的encoding取值有如下幾種:
#define OBJ_ENCODING_RAW 0 //簡(jiǎn)單動(dòng)態(tài)字符串,用于保存鍵值對(duì)的鍵和配置文件中的參數(shù)。
#define OBJ_ENCODING_INT 1 //整型值,用于優(yōu)化小整數(shù)的內(nèi)存使用。
#define OBJ_ENCODING_HT 2 //哈希表,用于存儲(chǔ)普通哈希對(duì)象的字段和值。
#define OBJ_ENCODING_ZIPMAP 3 //縮字典,這是一種特殊類型的哈希表,用于優(yōu)化小哈希對(duì)象的內(nèi)存使用。
#define OBJ_ENCODING_LINKEDLIST 4 //雙端鏈表,用于存儲(chǔ)列表鍵。
#define OBJ_ENCODING_ZIPLIST 5 //壓縮列表,用于優(yōu)化小列表或者小哈希對(duì)象的內(nèi)存使用。
#define OBJ_ENCODING_INTSET 6 //整數(shù)集合,用于優(yōu)化只包含整數(shù)元素的集合的內(nèi)存使用。
#define OBJ_ENCODING_SKIPLIST 7 //跳躍表和字典,用于存儲(chǔ)有序集合鍵。
#define OBJ_ENCODING_EMBSTR 8 //對(duì)于長(zhǎng)度小于44字節(jié)的字符串,Redis選擇使用此特殊的編碼方式。
#define OBJ_ENCODING_QUICKLIST 9 //對(duì)于列表對(duì)象(list object)的一種編碼方式。quicklist是ziplist和雙向鏈表的混合體。
三、Type與Encoding介紹
Redis支持五種主要的數(shù)據(jù)類型:字符串(String)、列表(List)、集合(Set)、有序集合(Sorted Set)和哈希(Hash)。
每種數(shù)據(jù)類型都有對(duì)應(yīng)的編碼方式,數(shù)據(jù)類型與編碼方式總覽如下:
數(shù)據(jù)類型 | 編碼方式 |
字符串 | int、embstr、raw |
哈希表 | ziplist、hashtable |
列表 | ziplist、linkedlist、quicklist |
集合 | intset、hashtable |
有序集合 | ziplist、skiplist |
1.字符串
字符串是Redis中最基本的數(shù)據(jù)類型,通常用于存儲(chǔ)文本或二進(jìn)制數(shù)據(jù)。字符串在Redis中支持三種編碼方式:
- int:當(dāng)字符串可以表示為整數(shù)時(shí),Redis會(huì)將其轉(zhuǎn)換為整數(shù),并采用int編碼方式存儲(chǔ)。int編碼方式的優(yōu)點(diǎn)是存儲(chǔ)空間小,操作效率高。缺點(diǎn)是只能存儲(chǔ)整數(shù),不支持字符串操作。
- embstr(embstr-encoded string) :保存長(zhǎng)度小于44字節(jié)的字符串,當(dāng)一個(gè)字符串比較短,采用此編碼方式存儲(chǔ),可以減少內(nèi)存占用。
- raw(raw-encoded string) :保存長(zhǎng)度大于44字節(jié)的字符串,當(dāng)一個(gè)字符串比較長(zhǎng)時(shí),采用此編碼方式存儲(chǔ)。
2.列表
列表是一系列有序的字符串集合,可以添加、修改和刪除元素。列表在Redis中支持三種編碼方式:
- ziplist:在Redis3.2版本之前,當(dāng)List列表中每個(gè)字符串的長(zhǎng)度都「小于64字節(jié)」并且List列表中「元素?cái)?shù)量小于512個(gè)」時(shí),List對(duì)象使用ziplist編碼,其他情況使用linkedlist編碼。ziplist是一種緊湊的、壓縮的列表結(jié)構(gòu),可以節(jié)省內(nèi)存,適用于小型列表。
- linkedlist:linkedlist是一種鏈表結(jié)構(gòu),支持任意大小的列表。但其內(nèi)存占用會(huì)隨著列表長(zhǎng)度的增加而增加。
- quicklist:Redis 3.2版本引入,quicklist是一種由多個(gè)ziplist組成的列表結(jié)構(gòu),既能保證性能,又能節(jié)省內(nèi)存,適用于大型列表。
3.集合
集合是一系列無(wú)序的字符串集合,支持添加、刪除和查詢?cè)?。集合在Redis中支持兩種編碼方式:
- intset:當(dāng)集合中的元素都是整數(shù)時(shí),Redis會(huì)采用intset編碼方式存儲(chǔ)。intset編碼方式的優(yōu)點(diǎn)是存儲(chǔ)空間小,操作效率高。
- hashtable:當(dāng)集合中的元素包含字符串時(shí),Redis會(huì)采用hashtable編碼方式存儲(chǔ)。hashtable編碼方式的優(yōu)點(diǎn)是可以存儲(chǔ)任意類型的元素,支持字符串操作。缺點(diǎn)是存儲(chǔ)空間相對(duì)較大,操作效率相對(duì)較低。
4.有序集合
有序集合是一系列無(wú)序的字符串集合,每個(gè)元素關(guān)聯(lián)一個(gè)分?jǐn)?shù),可以根據(jù)分?jǐn)?shù)排序。有序集合在Redis中支持兩種編碼方式:
- ziplist:當(dāng)集合中元素個(gè)數(shù)少于128個(gè),并且每個(gè)元素的大小小于64字節(jié)時(shí),使用此編碼方式。這是因?yàn)閦iplist在處理較小數(shù)據(jù)時(shí),內(nèi)存效率更高,性能更優(yōu)。
- skiplist:skiplist是一種跳躍表結(jié)構(gòu),支持快速查詢和排序。適用于大型有序集合。
5.哈希表
哈希表是一系列鍵值對(duì)集合,每個(gè)鍵關(guān)聯(lián)一個(gè)值。哈希表在Redis中支持兩種編碼方式:
- ziplist:保存的所有鍵值的字符串長(zhǎng)度小于64字節(jié),并且鍵值對(duì)數(shù)量小于512個(gè),Redis會(huì)采用ziplist編碼方式存儲(chǔ)。ziplist編碼方式的優(yōu)點(diǎn)是存儲(chǔ)空間小,操作效率高。缺點(diǎn)是不支持快速的鍵查找操作。
- hashtable:除上述條件之外,Redis會(huì)采用hashtable編碼方式存儲(chǔ)。hashtable編碼方式的優(yōu)點(diǎn)是支持快速的鍵查找操作,缺點(diǎn)是存儲(chǔ)空間相對(duì)較大,操作效率相對(duì)較低。
四、Type與Encoding底層原理
了解Redis支持的數(shù)據(jù)類型和編碼方式后,我們來看一下它們的底層實(shí)現(xiàn)原理。
1.編碼轉(zhuǎn)換
Redis中的每個(gè)鍵值對(duì)都有一個(gè)類型標(biāo)識(shí),表示該鍵值對(duì)的數(shù)據(jù)類型。當(dāng)我們對(duì)一個(gè)鍵進(jìn)行操作時(shí),Redis會(huì)根據(jù)該鍵當(dāng)前的編碼方式以及操作所需的編碼方式,對(duì)鍵值對(duì)進(jìn)行編碼轉(zhuǎn)換。
例如,當(dāng)我們向一個(gè)字符串中追加內(nèi)容時(shí),如果該字符串當(dāng)前的編碼方式為raw,但是新的內(nèi)容可以使用embstr編碼方式存儲(chǔ),那么Redis會(huì)將該字符串的編碼方式從raw轉(zhuǎn)換為embstr。
2.數(shù)據(jù)結(jié)構(gòu)
除了編碼方式外,Redis還使用了許多經(jīng)典的數(shù)據(jù)結(jié)構(gòu)來實(shí)現(xiàn)各種數(shù)據(jù)類型。例如,Redis的列表和哈希表都是采用鏈表結(jié)構(gòu)實(shí)現(xiàn)的。而有序集合則采用了跳躍表(Skip List)這種高效的數(shù)據(jù)結(jié)構(gòu)。
這些數(shù)據(jù)結(jié)構(gòu)都經(jīng)過了精心設(shè)計(jì)和優(yōu)化,以滿足各種場(chǎng)景下的應(yīng)用需求。例如,鏈表結(jié)構(gòu)適合頻繁地添加和刪除元素,而跳躍表結(jié)構(gòu)則適合排序和查找。
本篇博客介紹了Redis支持的五種主要數(shù)據(jù)類型以及相應(yīng)的編碼方式。
Redis的數(shù)據(jù)類型和編碼方式是為了在不同的場(chǎng)景下達(dá)到最佳的性能和內(nèi)存占用。理解這些類型和編碼機(jī)制,對(duì)于深化我們對(duì)Redis的認(rèn)識(shí),優(yōu)化其性能,以及發(fā)揮其最大潛力是至關(guān)重要的。
雖然每個(gè)項(xiàng)目的需求和應(yīng)用可能會(huì)有所不同,但通過精心選擇和使用合適的類型和編碼,我們都可以充分利用Redis為我們的應(yīng)用帶來的高效,快速和可靠。
總之,Redis的類型和編碼是其核心功能的基石,理解這些可以幫助我們更好地使用Redis,解決實(shí)際問題。當(dāng)你下次面臨需要決定使用哪種數(shù)據(jù)結(jié)構(gòu)或編碼方式的時(shí)候,希望你可以記住今天的內(nèi)容,并從中找到答案。感謝您抽出寶貴的時(shí)間閱讀這篇文章,希望它對(duì)您有所幫助!