数据结构词典

Posted 2022-11-30 aidata

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了数据结构词典相关的知识，希望对你有一定的参考价值。

散列：原理

技术图片

桶bucket：直接存放或间接指向一个词条（即词条的引用）

桶数组bucket array/散列表hash table，容量为M，即散列表长度

N < M << R

空间 = O(N+M)=O(N)

技术图片

定址/杂凑/散列：

根据词条的key（未必可比较）

直接确定散列表入口

散列函数：hash(): key->&entry 将关键码转为词条或它的入口

技术图片

电话簿

技术图片

可能会出现冲突

技术图片

二、散列：散列函数

无法杜绝的冲突

技术图片

两项基本任务

近似的单射，往往可行

技术图片

评价标准与设计原则

技术图片

除余法

技术图片

数据通常具有局部性Locality，典型的现象是数据序列中的数据项大多按某一步长单调变化（while、for）

如果数据序列的步长为S，S与M的最大公因子gcd(S, M)=G

当且仅当G=1时，数据序列的足迹能够遍布整个散列表

技术图片

因为可能有不同的程序，每个程序每次的运行对应的步长S未必相等，也就是说M相对于几乎任何S，最大公因子都只能是1。这意味着M是个素数。

MAD法

除余法的缺陷：

不动点：无论表长M取值如何，总有hash(0)=0
零阶均匀：[0, R)的关键码，平均分配至M个桶；但相邻关键码的散列地址也必相邻

一阶均匀：邻近的关键码，散列地址不再邻近

更高阶的均匀性呢？

技术图片

当然，特定场合下，未必需要高阶的均匀性

更多散列函数

技术图片

技术图片

总之，越是随机越是没有规律越好

（伪）随机数法

技术图片

技术图片

多项式法

技术图片

四、散列：排解冲突

事先预案

多槽位

技术图片

独立链

技术图片

开放地址

技术图片

线性试探

技术图片

懒惰删除

技术图片

平方试探

技术图片

优点、缺点及疑惑

技术图片

装填因子，须足够小

技术图片

技术图片

双向平方试探

技术图片

查找链，彼此独立？

技术图片

4k+3

双平方定理

技术图片

五、桶/计数排序

技术图片

以上是关于数据结构词典的主要内容，如果未能解决你的问题，请参考以下文章