Golang---BASE64编码原理

Posted 2020-11-23 zpcoding

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Golang---BASE64编码原理相关的知识，希望对你有一定的参考价值。

BASE64编码概念

　　Base64 是一种基于64个可打印字符来表示二进制数据的表示方法。在 Base64中可打印字符包括字母 A-Z, a-z, 数字 0-9，这样共有 62 个字符，另外两个可打印符号在不同的编码系统中不同。由于 2^6 = 64, 所以每 6 个比特为一个单元，对应某个可打印字符。比如：3 个字节(ASCII 表示)有 24 个比特，可由 4 个 Base64 编码的可打印字符来表示。

为什么要用 BASE64 编码

　　BASE64编码会把 3 字节的二进制数据编码为 4 字节的文本数据，长度增加 33%，为什么我们还要用这种编码方式呢？好处就是编码后的文本数据可以在邮件正文、网页等直接显示。

代码调用

　　在 golang 中提供了两种格式的数据供我们直接调用，用于实现 BASE64 的编码和解码：

// 来自 base64.go
const encodeStd = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/"
const encodeURL = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789-_"

　　标准数据(encodeStr)可打印符号为：encodeStd 中的符号：

    msg := "Mac"
    base64URLEncoding := base64.StdEncoding.EncodeToString(([]byte(msg)))
    fmt.Println("Base64编码后：", base64URLEncoding)
    // 解码
    base64DecodeByte, err := base64.StdEncoding.DecodeString(base64URLEncoding)
    if err != nil {
        log.Panic(err)
    }
    fmt.Println("Base64解码后的字节数组：", base64DecodeByte)
    fmt.Println("Base64解码后：", string(base64DecodeByte))

    // 输出结果：

　　　　Base64编码后： TWFj
　　　　Base64解码后的字节数组： [77 97 99]
　　　　Base64解码后： Mac

　　URL数据(encodeURL) 可打印符号为：encodeURL 中的符号：

    msgUrl := "http://www.google.com"
    base64UrlEncodedString := base64.URLEncoding.EncodeToString([]byte(msgUrl))
    fmt.Println("Base64编码后:", base64UrlEncodedString)
    base64UrlDecodedByte, err := base64.URLEncoding.DecodeString(base64UrlEncodedString)
    if err != nil {
        log.Panic(err)
    }
    fmt.Println("Base64解码后的字节数组:", base64UrlDecodedByte)
    fmt.Println("Base64解码后:", string(base64UrlDecodedByte))

　　// 输出结果

　　　　Base64编码后: aHR0cDovL3d3dy5nb29nbGUuY29t
　　　　Base64解码后的字节数组: [104 116 116 112 58 47 47 119 119 119 46 103 111 111 103 108 101 46 99 111 109]
　　　　Base64解码后: http://www.google.com

编码原理

step1: 将每个字符转成 ASCII 编码

msg := "Mac"
fmt.Println([]byte(msg))  // [77 97 99]

step2: 将 ASCII 转换成二进制编码

msg := "Mac"
fmt.Printf("%b
", []byte(msg))  // [1001101 1100001 1100011]

补齐 8 位为：

[01001101 01100001 01100011]

step3: 将二进制编码按照 6位一组进行平分

010011 010110 000101 100011

step4: 转换为十进制数：

010011--->19
010110--->22
000101--->5
100011--->35

step5: 将转换的十进制数作为索引，从 Base64 编码表中查找字符

索引              对应字符  
0-->25          A---->Z
26-->51         a----->z
52-->61         0----->9
62             "+" or  "-"
63             "/" or "_"

// 上面 "MAC" BASE64 编码结果为 TWFj
19---> T
22---> W
5 ---> F
35---> j