介绍常见的JSON压缩算法

Posted 2021-04-30 码农沉思录

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了介绍常见的JSON压缩算法相关的知识，希望对你有一定的参考价值。

https://blog.csdn.net/qq646350979/article/details/79841556

前言

无论使用何种编程语言，json格式的数据已被广泛应用，不论是数据的传输还是存储，在很多应用场景下，你可能想进一步地压缩JSON字符串的长度，以提升传输效率，如果你使用的是nosql数据库，你可能想进一步的压缩json字符串的长度来节省你的存储空间，接下来，我将介绍一下目前最常用的json数据压缩技术（CJSON和HPack）的实现（文章最后有彩蛋哦）。

CJSON

CJSON 的压缩算法，主要是将资料抽离成 Template 与 Value，节省掉重复的 "Key 值"。

原数据：

[
    {
        "x": 100,
        "y": 100    },
    {
        "x": 100,
        "y": 100,
        "width": 200,
        "height": 150    },
    {},
]

压缩之后：

{
    "templates": [        [0, "x", "y"],        [1, "width", "height"]    ],
    "values": [        {            "values": [1, 100, 100]        },        {            "values": [2, 100, 100, 200, 150]        },        {}    ]}

HPack

HPack 的压缩算法，也是将 Key、Value 抽离，阵列中第一个值，就是HPack 的 Template，后面依序就是 Value。

原数据：

[{
  name : "Andrea",
  age : 31,
  gender : "Male",
  skilled : true
}, {
  name : "Eva",
  age : 27,
  gender : "Female",
  skilled : true
}, {
  name : "Daniele",
  age : 26,
  gender : "Male",
  skilled: false
}]

压缩之后：

[
    ["name", "age", "gender", "skilled"],
    ["Andrea", 31, "Male", true],
    ["Eva", 27, "Female", true],
    ["Daniele", 26, "Male", false]
]

彩蛋

我在研究开源性能分析工具pinpoint的源码时，发现了里面有使用一种压缩比更高的做法，算法如下：

原数据：

{
  name : "Andrea",
  age : 31,
  gender : "Male",
  skilled : true
}

压缩后的示意图如下：

介绍常见的JSON压缩算法

压缩之后的数据变成了一串二进制数据，其中 name 和 gender 由于是 string 类型，长度不定，故使用他们的第一个四位数作为表示这个该name 对应值“Andrea”的二进制长度，其他类型的数据取值如下图的API：

这样的做法可以被认为是一种加密性质的压缩，如果数据接收方不知道数据结构，是无法直接解析出目标值的。需要数据发送发和数据接收方约定好字段的结构。

总结

从上面的例子中，我们发现，CJSON和HPack 都只是节省了 json数据键的大小，但是里面的中括号和引号都无用且大量冗余，我上面介绍的第三种压缩方法使用起来复杂度可能高一点，但是压缩比可以比上面的两种更好一些，不管是作为存储还是作为数据的传输，都可以节省大量的资源。

都看到这里了，不关注一下么

编程沉思录

一码不扫，何扫天下

以上是关于介绍常见的JSON压缩算法的主要内容，如果未能解决你的问题，请参考以下文章