当前位置：网站首页>浅谈 Redis 的底层数据结构

浅谈 Redis 的底层数据结构

2022-08-08 13:56:00 【daydreamed】

浅谈 Redis 的底层数据结构

1、简介

Redis 的底层数据结构主要包括以下六种：

简单动态字符串
双向链表
压缩列表
字典
跳跃表
整数集合

补充：

Redis 五大基本类型所使用的底层数据结构：

string（简单动态字符串）
list（双向链表、压缩列表）
- 当 list 保存的元素数量不超过 128 个，且元素长度都小于 64 字节采用压缩列表作为底层实现，否则采用双向链表作为底层实现
hash（压缩列表、字典）
- 当 hash 保存的键值对数量小于 512个，且键和值的字符串长度都小于 64 字节采用压缩列表作为底层实现，否则采用字典作为底层实现
set（整数集合）
zset（压缩列表、字典、跳跃表）
- 当 zset 保存的元素数量不超过 128 个，且元素长度都小于 64 字节采用压缩列表作为底层实现，否则采用字典、跳跃表作为底层实现

扩展：

redisObject 的数据结构如下：

typedef struct redisObject {
    
    // 数据类型 (基本数据结构: string、list、hash等等)
    unsigned [type] 4;
    // 内部编码 (底层数据结构: 简单动态字符串、双向链表、字典等等)
    unsigned [encoding] 4;
    // 当前对象可以保留的时长
    unsigned [lur] REDIS_LRU_BITS;
    // 对象引用计数，用于 GC
    int refcount;
    // 对象实际地址指针
    void *ptr;
}robj;

2、简单动态字符串（Simple Dynamic String，简称 SDS）

Redis 没有直接使用 C语言传统的字符串，而是自己构建了一种名为简单动态字符串（Simple Dynamic String）的抽象类型，并将 SDS 作为 Redis 的默认字符串表示。

SDS 的数据结构如下：

struct sdshdr{
    
    // 记录 buf 数组中已使用字节的数量
    // 等于 SDS 所保存字符串的长度
    int len;
    // 记录 buf 数组中未使用字节的数量
    int free;
    // 字节数组，用于保存字符串
    char buf[];
}

在这里插入图片描述

那为什么要使用 SDS 作为字符串的默认实现呢？

SDS 获取字符串长度的时间复杂度为常数
由于 C语言字符串并不记录自身的长度信息，所以要想获取字符串的长度则必须遍历整个字符串，时间复杂度为 O(N)；
而 SDS 只需要获取 len 属性的值就可以得到字符串的长度，时间复杂度为 O(1)。
SDS 杜绝了缓存区溢出
在对 C语言字符串进行修改时，如果没有事先手动重新分配空间的话，可能会造成数据溢出。
当 SDS API 需要对 SDS 进行修改时，API 会先检查 SDS 的空间是否满足修改所需的要求，如果不满足，API 会自动将 SDS 的空间扩展至所需大小，然后才执行实际的修改操作。
减少内存重分配次数
SDS 通过空间预分配和惰性空间释放两种优化策略来减少内存重分配次数：
- 空间预分配
  当进行字符串扩容操作时，Redis 会同时分配必要空间和额外未使用空间（长度存储在 free 属性），减少了连续执行字符串扩展操作所需的内存分配次数。
- 惰性空间释放
  当进行字符串缩容操作时，Redis 不会立即回收缩短后多余的空间，而是使用 free 属性记录起来，等待将来使用。
二进制安全
SDS API 会以处理二进制的方式来处理 SDS 存放在 buf 数组中的数据，Redis 不会对其中的数据做任何的限制、过滤或者假设（如：使用 len 属性的值而不是空字符来判断字符串是否结束），所以 SDS 的 API 都是二进制安全的。
兼容部分 C语言字符串函数
SDS 在字符串末尾添加一个空字符（‘\0’）是为了兼容一些 C语言字符串函数库（如：字符串对比函数 <string.h>/strcasecmp() ）。

3、双向链表

双向链表数据结构如下：

typedef struct list {
    
    // 表头节点
    listNode *head;
    // 表尾节点
    listNode *tail;
    // 链表所包含的节点数量
    unsigned long len;
    
    // 节点值复制函数
    void *(*dup)(void *ptr);
    // 节点值释放函数
    void *(*free)(void *ptr);
    // 节点值对比函数
    int *(*match)(void *ptr,void *key);
} list;

链表节点数据结构如下：

typedef struct listNode {
    
    // 前置节点
    struct listNode *prev;
    // 后置节点
    struct listNode *next;
    // 节点的值
    void *value
}listNode;

在这里插入图片描述

Redis 链表实现的特性：

双端
链表节点带有 prev 和 next 指针，获取某个节点的前置节点和后置节点的时间复杂度都是 O(1)。
无环
表头节点的 prev 指针和表尾节点的 next 指针都指向 NULL，对链表的访问以 NULL 为终点。
带表头指针和表尾指针
通过 list 结构的 head 指针和 tail 指针，程序获取链表的表头节点和表尾节点的时间复杂度为 O(1)。
带链表长度计数器
程序使用 list 结构的 len 属性来对 list 持有的链表节点进行计数，程序获取链表中节点数量的时间复杂度为 O(1)。
多态
链表节点使用 void* 指针来保存节点值，并且可以通过 list 结构的 dup、free、match 三个属性为节点值设置类型特定函数，所以链表可以用于保存各种不同类型的值。

4、压缩列表

压缩列表（ziplist），是 Redis 为了节约内存而设计的一种线性数据结构，它是由一系列具有特殊编码的连续内存块构成的。一个压缩列表可以包含任意多个节点，每个节点可以保存一个字节数组或一个整数值。

压缩列表的数据结构如下：

在这里插入图片描述

该结构当中的字段含义如下表所示：

属性	类型	长度	说明
zlbytes	uint32_t	4字节	压缩列表占用的内存字节数
zltail	uint32_t	4字节	压缩列表表尾节点距离列表起始地址的偏移量（单位字节）
zllen	uint16_t	2字节	压缩列表包含的节点数量，等于UINT16_MAX时，需遍历列表计算真实数量
entryX	列表节点	不固定	压缩列表包含的节点，节点的长度由节点所保存的内容决定
zlend	uint8_t	1字节	压缩列表的结尾标识，是一个固定值 0xFF

压缩列表节点的数据结构如下：

在这里插入图片描述

previous_entry_length（pel）属性以字节为单位，记录当前节点的前一节点的长度，其自身占据 1 字节或 5 字节：
1. 如果前一节点的长度小于 254 字节，则 “pel” 属性的长度为 1 字节，前一节点的长度就保存在这一个字节内；
2. 如果前一节点的长度达到 254 字节，则 “pel” 属性的长度为 5 字节，其中第一个字节被设置为 0xFE，之后的四个字节用来保存前一节点的长度；
基于 “pel” 属性，程序便可以通过指针运算，根据当前节点的起始地址计算出前一节点的起始地址，从而实现从表尾向表头的遍历操作。
content 属性负责保存节点的值（字节数组或整数），其类型和长度则由 encoding 属性决定，它们的关系如下：

encoding	长度	content
00 xxxxxx	1字节	最大长度为 2^6 -1 的字节数组
01 xxxxxx bbbbbbbb	2字节	最大长度为 2^14-1 的字节数组
10 __ bbbbbbbb … … …	5字节	最大长度为 2^32-1 的字节数组
11 000000	1字节	int16_t 类型的整数
11 010000	1字节	int32_t 类型的整数
11 100000	1字节	int64_t 类型的整数
11 110000	1字节	24位有符号整数
11 111110	1字节	8位有符号整数
11 11xxxx	1字节	没有 content 属性，xxxx 直接存 [0,12] 范围的整数值

5、字典

字典（dict）又称为散列表，是一种用来存储键值对的数据结构。C语言没有内置这种数据结构，所以Redis构建了自己的字典实现。

字典的数据结构如下：

typedef struct dict {
    
    // 类型特定函数
    dictType *type;
    // 私有数据
    void *data;
    // 哈希表
    dictht ht[2];
    // rehash 索引
    // 当 rehash 不在进行时，值为 -1
	int trehashidx;	/*rehashing not in progree if rehashidx == -1*/
} dict;

哈希表的数据结构如下：

typedef struct dictht {
    
    // 哈希表数组
    dictEntry **table;
    // 哈希表大小
    unsigned long size;
    // 哈希表大小掩码，用于计算索引值
    // 总是等于 size - 1
    unsigned long sizemask;
    // 该哈希表已有节点的数量
    unsigned long used;
} dictht;

哈希表节点的数据结构如下：

typedef struct dictEntry {
    
    // 键
    void *key;
    // 值
    union {
    
        void *val;
        uint64_tu64;
        int64_ts64;
    } v;
    // 指向下个哈希表节点，形成链表
    struct dictEntry *next;
} dictEntry;

字典主要由三个结构体：字典（dict）、哈希表（dictht）、哈希表节点（dictEntry）进行实现。

一个字典由两个哈希表构成
一个哈希表由多个哈希表节点构成
一个哈希表节点保存一个键值对

这三个结构体的关系如下图所示：

在这里插入图片描述

补充：dict 有两个 dictht，一个用于存储数据，一个用于重新散列（rehash）

当哈希表保存的键值对数量过多或过少时，需要对哈希表的大小进行扩展或收缩操作，在 Redis 中，扩展和收缩哈希表是通过 rehash 实现的，执行 rehash 的大致步骤如下：

为字典的 ht[1] 哈希表分配内存空间
如果执行的是扩展操作，则 ht[1] 的大小为第1个大于等于 ht[0].used*2 的 2n；如果执行的是收缩操作，则 ht[1] 的大小为第1个大于等于 ht[0].used 的 2n。
将存储在 ht[0] 中的数据迁移到 ht[1] 上
重新计算键的哈希值和索引值，然后将键值对放置到 ht[1] 哈希表的指定位置上。
将字典的 ht[1] 哈希表晋升为默认哈希表
迁移完成后，清空 ht[0]，再交换 ht[0] 和 ht[1] 的值，为下一次 rehash 做准备。

补充：

当满足以下任何一个条件时，程序会自动开始对哈希表执行扩展操作：

服务器目前没有执行 bgsave 或 bgrewriteof 命令，并且哈希表的负载因子大于等于 1
服务器目前正在执行 bgsave 或 bgrewriteof 命令，并且哈希表的负载因子大于等于 5

为了避免 rehash 对服务器性能造成影响，rehash 操作不是一次性地完成的，而是分多次、渐进式地完成的，渐进式 rehash 的详细过程如下：

为 ht[1] 分配空间，让字典同时持有 ht[0] 和 ht[1] 两个哈希表
在字典中的索引计数器 rehashidx 设置为 0，表示 rehash 操作正式开始
在 rehash 期间，每次对字典执行添加、删除、修改、查找操作时，程序除了执行指定的操作外，还会顺带将 ht[0] 中位于 rehashidx 上的所有键值对迁移到 ht[1] 中，再将 rehashidx 的值加 1
随着字典不断被访问，最终在某个时刻，ht[0] 上的所有键值对都被迁移到 ht[1] 上，此时程序将 rehashidx 属性值设置为 -1，标识 rehash 操作完成

补充：

rehash 期间，字典同时持有两个哈希表，此时的访问将按照如下原则处理：

新添加的键值对，一律被保存到 ht[1] 中
删除、修改、查找等其他操作，会在两个哈希表上进行，即程序先尝试去 ht[0] 中访问要操作的数据，若不存在则到 ht[1] 中访问，再对访问到的数据做相应的处理

6、跳跃表

跳跃表是一种有序数据结构，它通过在每个节点中维持多个指向其他节点的指针，从而达到快速访问节点的目的，跳跃表的查找复杂度为平均 O(logN)，最坏 O(N)。

补充：

有序链表插入、删除的复杂度为 O(1)，而查找的复杂度为 O(N)。例：若要查找值为60的元素，需要从第 1 个元素依次向后比较，共需比较 6 次才行，如下图：

在这里插入图片描述

跳跃表是从有序链表中选取部分节点，组成一个新链表，并以此作为原始链表的一级索引，再从一级索引中选取部分节点，组成一个新链表，并以此作为原始链表的二级索引。以此类推，可以有多级索引，如下图：

在这里插入图片描述

跳跃表在查找时，优先从高层开始查找，若 next 节点值大于目标值，或 next 指针指向 NULL，则从当前节点下降一层继续向后查找，这样便可以提高查找的效率了。

跳跃表的数据结构如下：

typedef struct zskiplist {
    
    // 表头节点和表尾节点
    struct skiplistNode *head, *tail;
	// 表中节点的数量
    unsigned long length;
    // 表中层数最大的节点的层数
    int level;
} zskiplist;

跳跃表节点的数据结构如下：

typedef struct zskiplistNode {
    
    // 层
    struct zskiplistLevel {
    
        // 前进指针
        struct zskiplistNode *forward;
        // 跨度，记录两个节点之间的距离
        unsigned int span;
    } level[];
    // 后退指针
    struct zskiplistNode *backward;
    // 分值
    double score;
    // 成员对象
    robj *obj;
} zskiplistNode;

跳跃表主要由两个结构体：zskiplist、zskiplistNode 进行实现。

在这里插入图片描述

补充：

节点层高的范围是 [1，ZSKIP_MAXLEVEL]，在 Redis 6 中层高的最大值为 32
头节点是特殊节点，它的层高为 32，不存储数据和分值，也不计入跳跃表的总长度和高度
创建节点时，程序会生成一个 [1，32] 之间的随机值作为该节点的层高，并且生成算法符合幂次定律（越大的数出现的概率越小）

7、整数集合

整数集合是 Redis 用于保存整数值的集合抽象数据结构，它可以保存类型为 int16_t 、int32_t 或者 int64_t 的整数值，并且保证集合中不出现重复值。

整数集合的数据结构如下：

typedef struct intset {
    
    // 编码方式：NTSET_ENC_INT16、INTSET_ENC_INT32、INTSET_ENC_INT64 
    uint32_t encoding;
    // 集合包含的元素数量
    uint32_t length;
    // 保存元素的数组
    int8_t contents[];
} intset;