当前位置: 首页 > news >正文

跳表数据结构

跳表(Skip List)是一种支持高效插入、删除和查找链表结构,用于加速查找操作,特别适用于有序数据集合。它在Redis、LevelDB等系统中被用于**有序集合(Sorted Set)**的实现。

1. 跳表的结构

跳表的核心思想是:
在链表的基础上,引入多级索引,类似于高速公路的匝道,提高查找效率。

一个跳表通常由多层索引构成:

  • 最底层(Level 0) 是一个有序单链表,存储所有数据;
  • 上层索引(Level > 0)部分节点构成,起到“跳跃”的作用,加速查找;
  • 最上层索引少量节点构成,使得查找可以迅速缩小范围。

示例跳表(3 层):

Level 2:    1 --------------> 9 ----------------> 19
Level 1:    1 ----> 5 -----> 9 ----> 13 -------> 19
Level 0:    1 -> 3 -> 5 -> 7 -> 9 -> 11 -> 13 -> 15 -> 17 -> 19

每一层都是上一层的子集,节点的“晋升”是概率性的(通常是 1/2)。

2. 跳表的基本操作

查找

跳表的查找过程类似于二分查找:

  1. 从最高层索引开始,查找小于目标值的最大节点;
  2. 向下移动到下一层索引,继续查找;
  3. 直到底层(Level 0),最终在普通链表中找到目标节点或确认其不存在。

时间复杂度:
O ( log ⁡ n ) O(\log n) O(logn) —— 因为跳表的高度是O(log n),查找路径长度也大约是O(log n)

插入

  1. 查找插入位置,找到前驱节点;
  2. 随机决定新节点的层数(常见做法:掷硬币,每次有 50% 概率提升一层);
  3. 在每一层进行插入,更新索引。

时间复杂度:

  • 平均 O(log n),因为最多遍历 log n 层;
  • 最坏 O(n)(所有元素都在同一层)。

删除

  1. 查找目标节点(与查找操作类似);
  2. 在每一层移除节点
  3. 如果某层为空,则删除该层

时间复杂度:
O ( log ⁡ n ) O(\log n) O(logn)

3. 跳表 vs. 其他数据结构

数据结构查找时间复杂度插入时间复杂度删除时间复杂度额外空间适用场景
跳表O(log n)O(log n)O(log n)O(n)有序数据、高效查找
平衡二叉搜索树 (AVL, 红黑树)O(log n)O(log n)O(log n)O(n)适用于动态数据
哈希表O(1)O(1)O(1)O(n)适用于无序数据、频繁查询
链表O(n)O(1)O(n)O(n)适用于插入、删除较多

跳表 vs. 红黑树

  • 跳表实现更简单,只需维护索引,而红黑树需要复杂的旋转操作;
  • 跳表在分布式环境中更友好,如 Redis 的有序集合(ZSet)采用跳表;
  • 红黑树适用于内存受限的场景,因为跳表的索引层需要额外存储空间。

4. 实际应用

Redis

Redis 有序集合(Sorted Set) 的底层结构是 跳表 + 哈希表

  • 跳表:用于范围查询ZRANGEZREVRANGE
  • 哈希表:用于O(1) 查找ZADD

LevelDB

Google 的 LevelDB 用跳表存储MemTable,然后刷盘成 SSTable

5. 代码实现(Java)

跳表节点

class SkipListNode {
    int val;
    SkipListNode[] next; // 指向不同层级的下一个节点

    public SkipListNode(int val, int level) {
        this.val = val;
        this.next = new SkipListNode[level];
    }
}

跳表类

import java.util.Random;

class SkipList {
    private static final int MAX_LEVEL = 16;  // 最大层数
    private final SkipListNode head; // 头节点
    private int levelCount = 1; // 当前最大层数
    private final Random random = new Random();

    public SkipList() {
        head = new SkipListNode(-1, MAX_LEVEL); // 初始化头节点
    }

    // 查找
    public boolean search(int target) {
        SkipListNode cur = head;
        for (int i = levelCount - 1; i >= 0; i--) {
            while (cur.next[i] != null && cur.next[i].val < target) {
                cur = cur.next[i];
            }
        }
        cur = cur.next[0];  // 进入最底层
        return cur != null && cur.val == target;
    }

    // 插入
    public void insert(int num) {
        SkipListNode[] update = new SkipListNode[MAX_LEVEL]; // 记录每层的前驱节点
        SkipListNode cur = head;

        for (int i = levelCount - 1; i >= 0; i--) {
            while (cur.next[i] != null && cur.next[i].val < num) {
                cur = cur.next[i];
            }
            update[i] = cur;  // 记录前驱节点
        }

        int newLevel = randomLevel();
        levelCount = Math.max(levelCount, newLevel);
        SkipListNode newNode = new SkipListNode(num, newLevel);

        for (int i = 0; i < newLevel; i++) {
            newNode.next[i] = update[i].next[i];
            update[i].next[i] = newNode;
        }
    }

    // 删除
    public void delete(int num) {
        SkipListNode cur = head;
        SkipListNode[] update = new SkipListNode[MAX_LEVEL];

        for (int i = levelCount - 1; i >= 0; i--) {
            while (cur.next[i] != null && cur.next[i].val < num) {
                cur = cur.next[i];
            }
            update[i] = cur;
        }

        SkipListNode target = cur.next[0];
        if (target == null || target.val != num) return;

        for (int i = 0; i < levelCount; i++) {
            if (update[i].next[i] != target) break;
            update[i].next[i] = target.next[i];
        }
    }

    // 随机生成层数
    private int randomLevel() {
        int level = 1;
        while (random.nextDouble() < 0.5 && level < MAX_LEVEL) {
            level++;
        }
        return level;
    }
}

6. 总结

  • 跳表通过多层索引加速查询,时间复杂度接近O(log n)
  • 插入/删除时动态调整索引,比红黑树实现简单;
  • Redis、LevelDB 等系统采用跳表,适用于有序集合、范围查询等场景;
  • 比红黑树占用更多空间,但更适合并发和分布式环境

相关文章:

  • 大数据学习(63)- Zookeeper详解
  • 索引-最左匹配
  • 【项目设计】基于AMQP协议实现的简单消息队列
  • android okhttp几种日志拦截级别区别
  • 数据可视化图表库LightningChart JS 全新发布v7.0——提高视觉质量
  • 7-9 抢红包
  • 从技术创新到全球布局:MOVA割草机器人以尖端科技定义智能园艺
  • 电脑一直重启怎么解决 原因及解决方法
  • PHP前后开发纪录
  • (2025|ICLR|厦大华为,LoSA,基于表示互信息的动态层级稀疏率,基于重构误差的秩分配)LLM 的动态低秩稀疏自适应
  • 【Academy】SSRF ------ Server-side request forgery
  • golang从入门到做牛马:第十八篇-Go语言递归函数:函数的“自我调用”
  • Java高频面试之集合-10
  • 大模型中的Token是什么?
  • 高效管理应用资源--Qt资源系统详解
  • 第四篇《XTTS 跨平台迁移:让数据库无缝跨越操作系统》(XTTS)
  • Labelme 3.16.7 数据标注(通过pycharm下载+颜色修改+批量转化json)
  • 14 | fastgo 三层架构设计
  • C++初阶—stack和queue类
  • 网络爬虫-1:发送请求+维持会话+代理设置/超时设置
  • 文化润疆|让新疆青少年成为“小小博物家”
  • 中国海警局新闻发言人就菲律宾非法登临铁线礁发表谈话
  • 伊朗爆炸港口已恢复货物进出口工作
  • 宣称防老年痴呆的“原装进口”保健品McPee被指涉假,未获澳方销售批准
  • 罗马教皇方济各葬礼在梵蒂冈举行
  • 调查丨当节气出现“时差”,陕西的果农们经历着什么?