当前位置：首页 > news >正文

哈希表的概念（散列表）

news 来源：原创 2025/4/20 22:50:41

一、基本概念

散列表特点：
数据元素的关键字与存储地址直接相关

通过哈希函数建立“关键字”与“存储地址”的联系

若不同的关键字通过散列函数映射到同一个值，则称它们为 “同义词”
通过散列函数确定的位置已经存放了其他元素，则称这种情况为 “冲突”

二、常见散列函数

除留取余法—H(key)=key%p
表长为m，取不大于m但最接近或等于m的质数
直接定址法—H(key)=a*key+b
适合 关键字分布基本连续 的情况
数字分析法—选取数码分布较为均匀的若干位作为散列地址

4.平方取中法—取关键字的平方值的中间几位作为散列地址

散列查找是典型的 “用空间换时间” 的算法，只要散列函数设计的合理，则散列表越长，冲突的概率越低。

三、处理冲突的方法

1.拉链法

用拉链法处理“冲突”：把所有“同义词”存储在一个链表中
在这里插入图片描述

2.开放定址法

空地址既对同义词开放，又向非同义词开放。其数学递推公式为
$H_i=(H(key)+d_i)\%m$
其中 $i\in[0,m-1]$ ，m表示散列表表长， $d_i$ 为增量序列；H（key）表示初始地址；i理解为“第i次发生冲突”

(1) 线性探测法

$d_i=0,1,2,...,m-1$

1存储操作
即发生冲突时，每次往后探测一个单元（向后挪1单元）。若为空，放入，若发生冲突，则接着挪

【易错点】
$H(key)=key\%p$
$H_i=(H(key)+d_i)\%m$
m和p不一定相等
例如：
在这里插入图片描述
n=13；p为不大于n且与n互质的数，为13
m为表长为16
$H(25)=25\%13=12$
$H_1=(12+1)\%16=13$

查找操作与存储操作类同。当查找到第一个空位，仍未找到，则查找失败。（例如查找21，从位置8开始查找，直到位置13，仍未找到。查找失败）

缺点：

(2) 平方探测法

$d_i=0,1,-1,2^2,-2^2,3^2,-3^2....$

存储操作
即发生冲突时，以H(key)为，向右向左探索。若为空，放入；若左右都冲突，探测下一个平方值，直至找到空位(eg. H(key)=9, 若10和8都冲突，探测13和5，以此类推)
【注意】：

在平方探测法中，由于偏移量有负，故要处理 $H_i=(H(key)+di(i))\%m<0$ 的情况。处理方法为:当 $di(i)<0时，H_i=(H(key)+di(i)+m)\%m$
在平方探测法中，散列表长度m必须是一个可以表示为4j+3的素数，才能探测到所有位置

(3) 伪随机序列法

$d_i=0,5,24,11,..$ 或其他给出的伪随机序列
与以上两种操作类同，不再赘述

【Python小游戏】2023兔年吉祥，祝大家辞旧迎新，前兔无量啦~兔年都在玩的这两款游戏，只有0.1%的人通关，你玩了吗？（内含福利源码）

【计算机程序设计思想与方法】2 什么是计算思维？

题库——“C”

若依框架 -------- vue3+element-plus(三)

MATLAB入门——线性规划、非线性规划、多目标规划

MobaXterm使用指南

电子技术——BJT的物理结构

VBA提高篇_18 VBA代码录制优化Select(tion)及表格合并Merge(cells()/Rows()/Columns()

数据结构（C++）图论基础

Python爬虫以及数据可视化分析之某站热搜排行榜信息爬取分析

JavaScript高级 ES7-ES13 新特性

Django的信号机制解读

线程安全的集合类（多线程环境下使用ArrayList、队列及哈希表）

JVM虚拟机简述

C++数论————质数筛法（单独判断一个数，判断N个数）埃氏筛法

区区几行代码，就能全面实现 Python 自动探索性数据分析

C++ 浅谈之智能指针 shared_ptr 循环引用

python之selenium入门教程

Power BI散点图

分享｜2023年全球市场准入认证咨讯

AI时代教育如何变革？上海首批 “标准化家长学校”出炉

龙登高谈近世的基层治理及制度变迁

接续驰援，中国政府援缅卫生防疫队出发赴缅

金融监管总局：建立保险销售人员违法违规导致经济损失的佣金薪酬追索扣回机制

“隐身”数年后重回公众视野的外滩美术馆

上海警方：男子拍摄女性视频后在网上配发诱导他人违法犯罪文字，被行拘