[转载]CRC32加密算法原理

Posted 2020-07-22

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了[转载]CRC32加密算法原理相关的知识，希望对你有一定的参考价值。

本文转载自: http://blog.163.com/yucheng_xiao/blog/static/76600192201393092918776/

一、基本原理

CRC检验原理实际上就是在一个p位二进制数据序列之后附加一个r位二进制检验码(序列)，从而构成一个总长为n＝p＋r位的二进制序列；附加在数据序列之后的这个检验码与数据序列的内容之间存在着某种特定的关系。如果因干扰等原因使数据序列中的某一位或某些位发生错误，这种特定关系就会被破坏。因此，通过检查这一关系，就可以实现对数据正确性的检验。

二、几个基本概念

1、帧检验序列FCS（Frame Check Sequence）：为了进行差错检验而添加的冗余码。

2、多项式模2运行：实际上是按位异或(Exclusive OR)运算，即相同为0，相异为1，也就是不考虑进位、借位的二进制加减运算。如：10011011 + 11001010 = 01010001。

3、生成多项式（generator polynomial）：当进行CRC检验时，发送方与接收方需要事先约定一个除数，即生成多项式，一般记作G（x）。生成多项式的最高位与最低位必须是1。常用的CRC码的生成多项式有：

CRC8=X8+X5+X4+1

CRC-CCITT=X16+X12+X5+1

CRC16=X16+X15+X5+1

CRC12=X12+X11+X3+X2+1

CRC32=X32+X26+X23+X22+X16+X12+X11+X10+X8+X7+X5+X4+X2+X1+1

每一个生成多项式都可以与一个代码相对应，如CRC8对应代码：100110001。

三、CRC检验码的计算

设信息字段为K位，校验字段为R位，则码字长度为N(N=K+R)。设双方事先约定了一个R次多项式g(x)，则CRC码：

V(x)=A(x)g(x)=xRm(x)+r(x)

其中: m(x)为K次信息多项式， r(x)为R-1次校验多项式。

这里r(x)对应的代码即为冗余码，加在原信息字段后即形成CRC码。

r(x)的计算方法为：在K位信息字段的后面添加R个0，再除以g(x)对应的代码序列，得到的余数即为r(x)对应的代码(应为R－1位；若不足，而在高位补0)。

计算示例

设需要发送的信息为M = 1010001101，产生多项式对应的代码为P = 110101，R＝5。在M后加5个0，然后对P做模2除法运算，得余数r(x)对应的代码：01110。故实际需要发送的数据是101000110101110。

技术分享

图 3.1

四、错误检测

当接收方收到数据后，用收到的数据对P（事先约定的）进行模2除法，若余数为0，则认为数据传输无差错；若余数不为0，则认为数据传输出现了错误，由于不知道错误发生在什么地方，因而不能进行自动纠正，一般的做法是丢弃接收的数据。

五、几点说明：

1、CRC是一种常用的检错码，并不能用于自动纠错。

2、只要经过严格的挑选，并使用位数足够多的除数 P，那么出现检测不到的差错的概率就很小很小。

3、仅用循环冗余检验 CRC 差错检测技术只能做到无差错接受（只是非常近似的认为是无差错的），并不能保证可靠传输。

六、数学推理

虽然以上内容已经有了一个较为清晰的数学计算过程，在这一小节将给出更为严谨的数学模型，以加深印象：

与第三节内容保持一致

1.设欲传输的信息有K位,如图6.1所示

2.首先将欲传输的数据序列m(x)乘以 X^R, 其中R为g(x)的最高次冥。

3.将得到的多项式X^Rm(x)除以约定的多项式g(x)

4.忽略除法结果的“商”，取出其余数，并与X^Rm(x)相加，形成K+R位的发送序列，即：m’(x) = X^Rm(x) +r(x)

图 6.1

CRC编码过程如下：

设待校验的信息码有k位，即：m = (m_k-1、m_k-2、m_k-3……m₁、m₀), 多项式m(x)可表示为

m(x) = m_k-1x^k-1+ m_k-2x^k-2+……m₁x¹+ m₀x⁰------------------------------------------------------------------------ 式（1）

用多项式g(x)的最高次幂R对应的X^R乘以m(x)，将得到式（2）

X^Rm(x) = m_k-1x^k+R-1+ m_k-2x^k+R-2+……m₁x^1+R+ m₀x^0+R-------------------------------------------------------- 式（2）

将X^Rm(x) 模2除以g(x)，得到多项式商为A(x),余数为r(x)，即：

A(x)g(x) = X^Rm(x) +r(x) -----------------------------------------------------------------------------------------------------式（3）

余数多项式r(x)可表示为

r(x) = r_R-1x^R-1+ r_R-2x^R-2+……r₁x¹+ r₀x⁰------------------------------------------------------------------------------------式（4）

将式（2）和式（4）代入式（3）得

A(x)g(x) = m_k-1x^k+R-1+ m_k-2x^k+R-2+……m₁x^1+R+ m₀x^0+R+ r_R-1x^R-1+ r_R-2x^R-2+……r₁x¹+ r₀x⁰--------式（5）

式（5）对应的码组为K+R位，即：

N = (m_k-1+ m_k-2+……m₁+ m₀+ r_R-1+ r_R-2+……r₁+ r₀) ------------------------------------------------------------式（6）

从M到N就是CRC的编码过程m_k-1+ m_k-2+……m₁+ m₀为k位信息码；r_R-1+ r_R-2+……r₁+ r₀为R位校验码。

在信息接收端，将接受到的K+R位码除以相同的多项式g(x),根据式（3）所产生的余数为0，则接受到的数据信息正确无误，否则则认为信息在传输过程中产生的误码。

根据式（1）~式（6），CRC编码必须进行模2除运算，CRC的校验位就是模2除得到的余数，如果余数用寄存器的存数表示，模2除用异或门表示，那么通用的CRC串行电路就可以同图6.2所示的电路来实现。

七、LFSR(线性反馈移位寄存器)的深入解析

在计算过程中，线性反馈移位寄存器是这样一种移位寄存器：它的输入位是之前状态的一个线性函数。如图7.1

蓝色方框位为输入位，而之前的状态就是0110，显然，按照这个图示，bit0的下一次的状态是bit2,bit3,为自变量的函数值。

图 7.1

那么这个函数是可以是什么呢？对于二进制算法无非就是一些门电路了，而最常用的线性函数则是异或门XOR。LFSR的初始化值称之为 seeD（形象点就是火种，比如7.1中的0110）,而且对寄存器的操作也是确定的，那么由这个移位寄存器产生的数据流也同样是由当前的状态确定，另一方面，因为这个移位寄存器的位数是有限且确定的，所以数据流最终必然会进入一个重复的周期循环中

图 7.2

说明：

1.因为函数的唯一性，所以有了箭头的唯一性。

2.因为4位LFSR的限制，所以，不管数据怎么形成，最终总是难免会重新进入0110的状态。

所以这个循环必然存在，正如如来佛对孙悟空说的，你怎么跑都跑不出我的五指山，当然实际情况并不是只有5个状态。

问题到这一步又会产生新的一个疑问？到底五指山有几根指头呢？答案是这样的——只要反馈函数选择适当，产生的随机序列将会跑很多的“指头”才能返回到初始状态，也就是说循环周期会很长。具体的例子请参考图7.3

图 7.3

A 4-bit Fibonacci LFSR with its state diagram. The XOR gate provides feedback to the register that shifts bits from left to right. The maximal sequence consists of every possible state except the "0000" state.

CRC（循环冗余校验）与LFSR有很相似的地方，为什么这么说呢？继续分析，先来看一下一种特殊结构的LFRS。

Galois LFRS (伽罗瓦线性反馈移位寄存器）

什么是伽罗瓦线性反馈移位寄存器呢？只是为了纪念一个数学家，他的名字叫伽罗瓦，知道这点也就够了，最主要的是掌握它的结构特性，它到底有什么特点呢? 对照图7.4所示

1>模块化；2>异或门插在内部；3>一对多的LFSR