什么是Hash函数?Hash函数在密码学中有什么作用?
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了什么是Hash函数?Hash函数在密码学中有什么作用?相关的知识,希望对你有一定的参考价值。
Hash,一般翻译做"散列",也有直接音译为"哈希"的,就是把任意长度的输入(又叫做预映射, pre-image),通过散列算法,变换成固定长度的输出,该输出就是散列值。这种转换是一种压缩映射,也就是,散列值的空间通常远小于输入的空间,不同的输入可能会散列成相同的输出,而不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。HASH主要用于信息安全领域中加密算法,他把一些不同长度的信息转化成杂乱的128位的编码里,叫做HASH值. 也可以说,hash就是找到一种数据内容和数据存放地址之间的映射关系
Hash算法在信息安全方面的应用主要体现在以下的3个方面:
1) 文件校验
我们比较熟悉的校验算法有奇偶校验和CRC校验,这2种校验并没有抗数据篡改的能力,它们一定程度上能检测并纠正数据传输中的信道误码,但却不能防止对数据的恶意破坏。
MD5 Hash算法的"数字指纹"特性,使它成为目前应用最广泛的一种文件完整性校验和(Checksum)算法,不少Unix系统有提供计算md5 checksum的命令。
2) 数字签名
Hash 算法也是现代密码体系中的一个重要组成部分。由于非对称算法的运算速度较慢,所以在数字签名协议中,单向散列函数扮演了一个重要的角色。 对 Hash 值,又称"数字摘要"进行数字签名,在统计上可以认为与对文件本身进行数字签名是等效的。而且这样的协议还有其他的优点。
3) 鉴权协议
如下的鉴权协议又被称作"挑战--认证模式:在传输信道是可被侦听,但不可被篡改的情况下,这是一种简单而安全的方法。 参考技术A hash函数页称散列函数 哈希函数 杂凑函数,是一个从消息空间到像空间的不可逆映射。作用:数字签名,生成程序或文档的“数字指纹”,用于安全传输和存储口令!
虾说区块链什么是hash算法?什么是好的hash算法?
欢迎收听「虾说区块链」。现在区块链这个概念在互联网上相当火热,这里简单做一个普及,不涉及项目推广投资,单纯地对区块链相关基础知识概念作一个说明讲解。本人区块链技术爱好者,结合相关区块链资料总结整理了「虾说区块链」,也是自己一个学习笔记,涉及相关内容如理解有误,也请及时指正。
1
hash算法也称为散列函数算法,在区块链中应用的相当频繁,在说明hash算法之前先明确一个概念。
计算机在底层机器码是采用二进制的模式,所谓二进制简单来说就是底层以0/1来标识,所有数据传输记录都以010101的模式来存储记录,两种状态也可认为就是一个日常生活中的开关,1标识开,0标识关。那么计算机中最小的数据单位也就是这里说的0或者1,这里我们称为bit(比特或者位),8个bit组成一个字节。当然计算机中也有八进制、十六进制的表示,这里暂时不展开讨论。只明确底层一个二进制的概念。
2
Hash算法广泛应用于计算机信息科学领域中,也是十分基础的密码学相关知识。
Hash表,也称散列表,学过计算机数据结构的都比较清楚这个概念。Hash表是根据关键码值(key、value)而进行直接访问的数据结构,把关键码值映射到表中中一个位置来访问记录,加快查找速度,这个映射的函数称为hash函数,存放记录的数组叫散列表。
先来看一个转换:touhezijindeyu经过各种hash加密后得到的值:
MD5加密:
5f1a4fc86d69f850bdd9d972a9b51011
SHA256加密:
b71718959b8a7673e8593bd6a21dc81eb5279e89fd4edc32d648ece57ed7056d
SHA512加密:
0264b0a70c46e7a05ba6fff156ff51738e0d39038fa662575e0a6603412c8c7119dba6aa76d294338a0156ee22cd10d379f5848b1a45a6027fdc5c47b0366198
Hash算法能把任意长度的二进制值映射为固定长度的二进制值,一般来说前一个二进制值我们成为明文,后面通过映射后得到的固定二进制值成为密文或者成为hash值。一旦在明文做任何修改,密文hash值就会有较大出入。
良好的hash算法需要满足:
快速定向:输入明文后,hash函数能在有限的时间和资源下计算出hash值。
难以逆推:得到密文hash值后,在规定的时间内无法推导出明文(注意是规定时间内,这个理论上和实际还是有一些区别)。
明文修改异常:明文稍作修改,密文hash值会有较大出入。
避免冲突:不同明文,难以出现相同密文hash值。
Hash函数一个映像的关系组,那么理论上会出现,明文x不等于y,那么f(x)=f(y)的情况。避免出现不同明文出现相同hash值,这种称为抗碰撞性,也就是上文说到的解决冲突。
散列函数的值需要尽可能的平均,同时需要良好的处理冲突的方法,一般解决冲突的方法如下:
线性探查法:发生冲突后,线性向前去探索,找到一个附近的空位置。这种方法会导致出现堆积现象,那么在存取的时候,无法明确同义词,那么盲目探查序列,这种探查法比较线性,原理较为明了,但是整个执行效率就会受到较大影响。
双散列函数法:在位置冲突后,再次使用一次散列函数进行计算,使得探查序列跳跃式分布。
常用的构造散列函数的方法:
Hash函数分类:
加法hash:把输入的元素一个个加起来的到最终结果。
位运算hash:通过利用各种位运算,移位或者异或来混合输入元素。
乘法hash:利用乘法的不相关性。比如乘以一个固定或者不停变化的数。
除法hash:和乘法的不相关性类似,但是除法效率较慢,所以应用较少。
查表hash:CRC系列相关算法。
混合hash:通过混合上述5种方式。
Hash算法应用:
校验文件:上述CRC校验和奇偶校验算法,防止数据篡改,MD5算法,目前听到的较多的一种校验文件完整性算法。
数字签名:由于非对称算法的运算速度,在常用数字签名协议中,单向的散列函数都是比较常用的,对于hash值,又会称为“数字摘要”进行数字签名。
挑战-认证模式:一般用于信道传输过程中,防止侦听破坏的一种方式。
Hash函数使用限制:
Hash函数中,不论输入的文件长度多少,输出结果都是一组固定长度的数字字符,结合加密方法的概念,hash算法是一个不可逆向的单项函数。文件有任意改动,即可检测出来。同时hash算法是一个无限大范围映射到一个有限小范围的模式,那么节省空间同时便于查找。
当然不是所有都适合hash算法,总结以下几个限制:
hash函数是大范围映射到小范围,故实际输入考虑和小范围相当或者更小,理论上尽量避免冲突。
hash函数是单向不可逆。
上期回顾:
下期预告:【虾说区块链】区块链的3种加密算法及安全要求详解(附代码)
点击“阅读原文”进入直播室听专栏音频。
以上是关于什么是Hash函数?Hash函数在密码学中有什么作用?的主要内容,如果未能解决你的问题,请参考以下文章