Python数据结构-哈希表(Hash Table)

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python数据结构-哈希表(Hash Table)相关的知识,希望对你有一定的参考价值。

参考技术A

哈希表(Hash Table) :通过键 key 和一个映射函数 Hash(key) 计算出对应的值 value,把关键码值映射到表中一个位置来访问记录,以加快查找的速度。
哈希函数(Hash Function) :将哈希表中元素的关键键值映射为元素存储位置的函数。
哈希冲突(Hash Collision) :不同的关键字通过同一个哈希函数可能得到同一哈希地址。
哈希表的两个核心问题是: 「哈希函数的构建」 「哈希冲突的解决方法」

常用的哈希函数方法有:直接定址法、除留余数法、平方取中法、基数转换法、数字分析法、折叠法、随机数法、乘积法、点积法等。
常用的哈希冲突的解决方法有两种:开放地址法和链地址法。

给你一个整数数组 nums 和两个整数 k 和 t 。请你判断是否存在 两个不同下标 i 和 j,使得 abs(nums[i] - nums[j]) <= t ,同时又满足 abs(i - j) <= k 。

如果存在则返回 true,不存在返回 false。

给定两个数组 nums1 和 nums2 ,返回 它们的交集 。输出结果中的每个元素一定是 唯一 的。我们可以 不考虑输出结果的顺序 。

给你两个整数数组 nums1 和 nums2 ,请你以数组形式返回两数组的交集。返回结果中每个元素出现的次数,应与元素在两个数组中都出现的次数一致(如果出现次数不一致,则考虑取较小值)。可以不考虑输出结果的顺序。

请你判断一个 9 x 9 的数独是否有效。只需要 根据以下规则 ,验证已经填入的数字是否有效即可。
数字 1-9 在每一行只能出现一次。
数字 1-9 在每一列只能出现一次。
数字 1-9 在每一个以粗实线分隔的 3x3 宫内只能出现一次。(请参考示例图)

力扣217
力扣389
力扣496

内容参考: https://algo.itcharge.cn/05.%E5%93%88%E5%B8%8C%E8%A1%A8/01.%E5%93%88%E5%B8%8C%E8%A1%A8%E7%9F%A5%E8%AF%86/

数据结构 -- 哈希表(hash table)

简介

   哈希表(Hash table,也叫散列表),是根据关键码值(Key value)而直接进行访问的数据结构。也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数叫做散列函数,存放记录的数组叫做散列表

  记录的存储位置=f(关键字)

  这里的对应关系f称为散列函数,又称为哈希(Hash函数),采用散列技术将记录存储在一块连续的存储空间中,这块连续存储空间称为散列表或哈希表(Hash table)。

  哈希表hashtable(key,value):

  1. 把Key通过一个固定的算法函数既所谓的哈希函数转换成一个整型数字

  2. 然后就将该数字对数组长度进行取余取余结果就当作数组的下标

  3. 将value存储在以该数字为下标的数组空间里。

    技术图片

  左边很明显是个数组,数组的每个成员包括一个指针指向一个链表的头,当然这个链表可能为空,也可能元素很多。

  我们根据元素的一些特征把元素分配到不同的链表中去,也是根据这些特征,找到正确的链表,再从链表中找出这个元素。

  Hash Table的查询速度非常的快,几乎是O(1)的时间复杂度。hash就是找到一种数据内容和数据存放地址之间的映射关系。

   散列法:元素特征转变为数组下标的方法。


 

哈希冲突

  哈希化之后难免会产生一个问题,那就是对不同的关键字,可能得到同一个散列地址,即同一个数组下标,这种现象称为哈希冲突。

  那么我们该如何去处理冲突呢?

  1. 开放地址法:通过系统的方法找到数组的另一个空位,把数据填入,而不再用哈希函数得到的数组下标,因为该位置已经有数据了;

  2. 链地址法:  创建一个存放链表的数组,数组内不直接存储数据,这样当发生冲突时,新的数据项直接接到这个数组下标所指的链表中。

  3. 公共溢出区法建立一个特殊存储空间,专门存放冲突的数据。此种方法适用于数据和冲突较少的情况。

  4. 再散列法(再哈希法):准备若干个hash函数,如果使用第一个hash函数发生了冲突,就使用第二个hash函数,第二个也冲突,使用第三个……


Hash函数 

  hash地址冲突几率,与hash函数密切相关。以下我们看下常用的计算hash地址的函数

  (A)直接定址法

    取关键字或者关键字的某个线性函数作为Hash地址,即address(key) = a*key + b; 如果知道学生的学号是从2000开始,最大为4000,则可以将address(key) =key-2000作为Hash地址。

  (B)平方取中法

    对关键字进行平方计算,然后取结果的中间几位作为Hash地址,假如有以下关键字序列{421,423,436},平方之后的结果为{177241,178929,190096},那么可以取中间的两位数{72,89,00}作为Hash地址。

  (C)折叠法

    将关键字拆分成几个部分,然后将这几个部分组合在一起,以特定的方式进行转化形成Hash地址。例如假如知道某图书的SBN号为:8903-241-23,可以将address(key)=89+03+24+12+3作为Hash地址。

  (D)除留取余法

    如果知道Hash表的最大长度为m,可以取不大于m的最大质数p,然后对关键字进行取余运算address(key)=key % p

 

待更新

 

参考:https://blog.csdn.net/eson_15/article/details/51138588 https://www.jianshu.com/p/5a2a5f6de440

以上是关于Python数据结构-哈希表(Hash Table)的主要内容,如果未能解决你的问题,请参考以下文章

哈希表 hash table

哈希表(Hash Table)与哈希算法

数据结构 -- 哈希表(hash table)

数据结构与算法哈希表 (hash table)

哈希表(hash table)基础概念

学习数据结构笔记 ---[哈希表(Hash table)]