全面解析区块链数字货币4种哈希算法原理与差异

Posted 2021-04-30 物联网芯片

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了全面解析区块链数字货币4种哈希算法原理与差异相关的知识，希望对你有一定的参考价值。

全世界只有不到3 % 的人关注了物联网芯片

你真是个特别的人

谁能想到，我们之前用作校验文件，核验数据的一种算法，现在却奠定了区块链数字货币帝国大厦，这个算法有很多名字，比如一般叫做哈希算法（HASH的英文而来），有的也称在杂凑算法（很形象~~）或者散列算法等（以下我们统称哈希）。那么现在我们就来解开这种算法的层层面纱，在本文中，我们将解析加密货币中最常用的四种加密哈希函数的特性和差异。但在此之前，还是需要了解哈希的含义。

什么是HASH（哈希）

简单来说，哈希意味着输入任意长度的字符串通过密码运算来实现固定长度的输出。在像比特币这样的加密货币的情况下，交易被视为输入并通过哈希算法（比特币使用SHA-256）运行（该算法提供固定长度的输出）。

先了解下哈希算法是如何工作的。我们以SHA-256（256位安全哈希算法）为例。

在SHA-256的情况下，无论你的输入有多大或多小，输出总是有一个固定的256位长度。这对于处理大量的数据和事务校验时非常关键，这里先看看哈希函数的各种特性以及它们在区块链中的实现方式。

加密哈希算法特性

哈希算法其特俗的特性使得非常适合密码应用，加密哈希算法具有以下几个特性：

特性 1：确定性

这意味着无论你通过哈希函数解析特定输入多少次，你都会得到相同的结果。这是至关重要的，因为如果每次都得到不同的哈希值，就不可能跟踪输入。

特性2：快速计算

哈希函数应该能够快速返回输入的哈希。

性质3：单向性

单向性指的是：假设A是输入数据并且H(A)是输出哈希结果，假设给定H(A)来倒推出A是“不可行”的（注意使用“不可行”一词而不是“不可能”）。

因为我们已经知道从它的哈希值中确定原始输入并不是“不可能”的。举个例子吧。

假设你掷骰子，输出是骰子出现的数字的哈希。我们将如何确定原始号码是什么？很简单，所要做的就是从1-6中找出所有数字的哈希值并进行比较。由于哈希函数是确定性的，所以特定输入的哈希总是相同的，因此我们可以简单地比较哈希并找出原始输入。

但是，只有在给定的数据量非常少的情况下，这才有效。当你有大量的数据时会发生什么？假设你正在处理128位哈希。唯一必须找到原始输入的方法是使用“暴力群举”。暴力群举基本上意味着你必须选取一个随机输入，对其进行哈希，然后将输出与目标哈希进行比较并重复，直到找到匹配。

如果你使用这种暴力方法后：

最好的结果：你可能在第一次尝试时获得答案，不过这只是理论上的可能，因为他的概率是2的128次方分之1（自己去算算）。

最坏的情况：你在2 ^ 128 - 1次之后得到答案。基本上，这意味着你会在所有数据的末尾找到你的答案。

平均情景：在2 ^ 128/2 = 2 ^ 127次之后，你会在中间的某处找到它。从这个角度来看，2 ^ 127 = 1.7 *10 ^ 38。换句话说，这是一个巨大的数字。

所以，虽然可以通过暴力方法来打破单向性，但同时也要有巨大的算力投入。

特性4：雪崩效应。

即使你对原始输入数据进行了小改动，哈希的结果差异也非常大。让我们使用SHA-256对其进行测试：

即使你只是改变了输入的第一个字母表的大小写，看看它对输出哈希值有多大影响。

这个特性也被称为雪崩效应。

性质5：防碰撞

给定两个不同的输入A和B，其中H（A）和H（B）是它们各自的哈希，H（A）等于H（B）是不可行的。这意味着大多数情况下，每个输入都会有自己独特的哈希。为什么我们说“大部分”？为了理解这一点，我们需要知道什么是“生日悖论”。

什么是生日悖论？

如果你在街上碰到任何陌生人，那么你们两个都有相同的生日的可能性非常低。事实上，假设一年中的所有日子都有生日的可能性，另一个人分享你的生日的机会是1/365，这是0.27％：概率非常低。

不过，如果你在一个房间里聚集20-30人，那么两个分享完全相同生日的人的几率会大幅度上升。

全面解析区块链数字货币4种哈希算法原理与差异

生日悖论

这是基于一个简单的概率原理：

假设你有一个事件发生N种不同的可能性，那么你需要N个随机项的平方根，以使它们有50％的碰撞几率。

因此，将这个理论应用于生日时，你有365种不同的生日可能性，所以你只需要Sqrt（365），即约23％，随机选择两个人分享生日的可能性为50％。

假设你有一个128位哈希，有2 ^ 128种不同的可能性。通过使用生日悖论，你有50％的几率在sqrt（2 ^ 128）= 2 ^ 64的情况下打破防碰撞机制。

正如你所看到的，打破防碰撞要比打破单向性容易得多。所以，如果你使用的是SHA-256这样的函数，假设如果H（A）= H（B），那么A = B是可以认为成立。

那么，你如何创建一个抗碰撞的哈希函数？为此，我们使用一种称为Merkle-Damgard的结构。

什么是Merkle-Damgard结构？

该结构非常简单，并且遵循以下原则：给定短消息的防碰撞哈希函数，我们可以为长消息构造防碰撞哈希函数。

全面解析区块链数字货币4种哈希算法原理与差异

图片来源：youtube

记住上面的图表，注意以下几点：

较大的消息M被分解为m [i]的较小块。
哈希函数H由许多较小的哈希函数“h”组成。
“h”是一个较小的哈希函数，又称压缩函数，它接收一小块消息并返回一个哈希。
第一个哈希函数“h”（在上图中圈出）接收第一个消息块（m [0]），并添加一个固定值IV并返回哈希值。
哈希现在被添加到第二个消息块并通过另一个哈希
函数h，并且这一直持续到最后的消息块，其中填充块PB也被添加到消息中。
每个压缩函数h的输出被称为链接变量。
填充块是一系列1和0。在SHA-256算法中，PB长64位。
哈希压缩函数h的输出是大消息M的输出。

既然已经了解了哈希方法以及加密哈希函数的特性，让我们熟悉一些加密货币中最常用的加密哈希函数。

先把几种加密哈希算法列出来：

MD 5：它产生一个128位哈希。在~2 ^ 21哈希后，防碰撞机制被打破。
SHA 1：生成一个160位哈希。经过2 ^ 61次哈希后，防碰撞机制被打破。
SHA 256：产生一个256位哈希。这是目前比特币正在使用的。
Keccak-256：产生256位哈希，目前由Ethereum使用。
RIPEMD-160：产生160个输出，由比特币脚本（和SHA-256）使用。
CryptoNight：Monero使用的哈希函数。

安全哈希算法（SHA）

安全哈希算法是由美国国家标准与技术研究院（NIST）发布的美国联邦信息处理标准（FIPS）的一系列加密哈希函数。SHA由以下算法组成：

SHA-0：指1993年发布的名为“SHA”的原始160位哈希函数。由于未公开的“重大缺陷”，并在稍后修订的版本SHA-1中取而代之，它在出版后不久被撤回。
SHA-1：当SHA-0传送失败时被引入。这是一个160位哈希函数，类似于早期的MD5算法。这是由国家安全局（NSA）设计的数字签名算法的一部分。然而，人们注意到加密图形的弱点之后不久就被抛弃了。
SHA-2：现在我们来看一下哈希函数中最受欢迎的类别之一。它是由NSA使用Merkle-Damgard范例设计的。它们是具有不同字长的两种哈希函数族：SHA-256和SHA-512。比特币使用SHA-256
SHA-3：之前被称为keccak，它在2012年被非NSA设计师的公开竞争之后选中。它支持与SHA-2相同的哈希长度，其内部结构与SHA系列的其他部分有很大不同。以太坊使用这个哈希函数。

全面解析区块链数字货币4种哈希算法原理与差异