19-json与pickle模块

Posted Jil-Menzerna

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了19-json与pickle模块相关的知识,希望对你有一定的参考价值。

一、json模块

1.1 什么是序列化&反序列化

内存中的数据类型---->序列化---->特定的格式(json格式或者pickle格式)
内存中的数据类型<----反序列化<----特定的格式(json格式或者pickle格式)

土办法:
{\'aaa\':111}--->序列化str({\'aaa\':111})----->"{\'aaa\':111}"
{\'aaa\':111}<---反序列化eval("{\'aaa\':111}")<-----"{\'aaa\':111}"

1.2 为何要序列化

序列化得到结果=>特定的格式的内容有两种用途
1、可用于存储=》用于存档
2、传输给其他平台使用=》跨平台数据交互
python java
列表 特定的格式 数组

强调:
针对用途1的特定一格式:可是一种专用的格式=》pickle只有python可以识别
针对用途2的特定一格式:应该是一种通用、能够被所有语言识别的格式=》json

1.3 如何序列化与反序列化

# 示范1
import json
# 序列化
json_res=json.dumps([1,\'aaa\',True,False])
print(json_res,type(json_res)) # "[1, "aaa", true, false]"
#
# 反序列化
l=json.loads(json_res)
print(l,type(l))

1、序列化写入文件

 

import json

# 序列化的结果写入文件的复杂方法
json_res=json.dumps([1,\'aaa\',True,False])
# print(json_res,type(json_res)) # "[1, "aaa", true, false]"
with open(\'test.json\',mode=\'wt\',encoding=\'utf-8\') as f:
    f.write(json_res)

# 将序列化的结果写入文件的简单方法
with open(\'test.json\',mode=\'wt\',encoding=\'utf-8\') as f:
    json.dump([1,\'aaa\',True,False],f)

 

2、反序列化读取文件

 

# 从文件读取json格式的字符串进行反序列化操作的复杂方法
with open(\'test.json\',mode=\'rt\',encoding=\'utf-8\') as f:
    json_res=f.read()
    l=json.loads(json_res)
    print(l,type(l))

# 从文件读取json格式的字符串进行反序列化操作的简单方法
with open(\'test.json\',mode=\'rt\',encoding=\'utf-8\') as f:
    l=json.load(f)
    print(l,type(l))

 

 

 

1.4 json格式

1、json格式不可与python混淆,str为双引号。

2、json中只有以上格式,不能识别某一语言所独有的类型。

import json
# json验证: json格式兼容的是所有语言通用的数据类型,不能识别某一语言的所独有的类型
# json.dumps({1,2,3,4,5})                           # error: Object of type set is not JSON serializable

# json强调:一定要搞清楚json格式,不要与python混淆
l=json.loads(\'[1, "aaa", true, false]\')             # corroct
l=json.loads("[1,1.3,true,\'aaa\', true, false]")     # error:json.decoder.JSONDecodeError: Expecting value: line 1 column 13 (char 12)
print(l[0])

 

 

 

 

3、json在python3.5以后,可以识别bytes类型,但只可读,不可写。(wb模式下,不可直接使用 json.dump(user_dict,f),其内部会将user_dict转换成str再写入,而此时系统分配的文件权限是b模式

4、在json中出现中文,会以Unicode的二进制编码以字符串类型存入

l = json.loads(b\'[1, "aaa", true, false]\')
print(l, type(l))
#
with open(\'test.json\',mode=\'rb\') as f:
    l=json.load(f)


res=json.dumps({\'name\':\'哈哈哈\'})
print(res,type(res))            # {"name": "\\u54c8\\u54c8\\u54c8"} <class \'str\'>

res=json.loads(\'{"name": "\\u54c8\\u54c8\\u54c8"}\')
print(res,type(res))            # {\'name\': \'哈哈哈\'} <class \'dict\'>

 

 1.5 猴子补丁

在入口处打猴子补丁,不用改原代码,也无须在子文件中处处改为 import ujson as json

# 在入口处打猴子补丁
import json
import ujson

def monkey_patch_json():
    json.__name__ = \'ujson\'
    json.dumps = ujson.dumps
    json.loads = ujson.loads

monkey_patch_json()     # 在入口文件出运行

 

 二、pickle 模块

内存中的数据类型---->序列化---->特定的格式(json格式或者pickle格式)
内存中的数据类型<----反序列化<----特定的格式(json格式或者pickle格式)
pickle为python可识别的,且无类型限制。

import pickle
 
dic={\'name\':\'alvin\',\'age\':23,\'sex\':\'male\'}
 
print(type(dic))#<class \'dict\'>
 
j=pickle.dumps(dic)
print(type(j))#<class \'bytes\'>
 
 
f=open(\'序列化对象_pickle\',\'wb\')#注意是w是写入str,wb是写入bytes,j是\'bytes\'
f.write(j)  #-------------------等价于pickle.dump(dic,f)
 
f.close()
#-------------------------反序列化
import pickle
f=open(\'序列化对象_pickle\',\'rb\')
 
data=pickle.loads(f.read())#  等价于data=pickle.load(f)
 
 
print(data[\'age\'])

 

python2 python3 兼容性问题

# coding:utf-8
import pickle

with open(\'a.pkl\',mode=\'wb\') as f:
    # 一:在python3中执行的序列化操作如何兼容python2
    # python2不支持protocol>2,默认python3中protocol=4
    # 所以在python3中dump操作应该指定protocol=2
    pickle.dump(\'你好啊\',f,protocol=2)

with open(\'a.pkl\', mode=\'rb\') as f:
    # 二:python2中反序列化才能正常使用
    res=pickle.load(f)
    print(res)

python2与python3的pickle兼容性问题

 

 

 三、XML

现在已逐渐被淘汰,详细可参照这篇博客:https://www.cnblogs.com/linhaifeng/articles/6384466.html#_label8

 

 

 

 

 

以上是关于19-json与pickle模块的主要内容,如果未能解决你的问题,请参考以下文章

21天学习python编程_pickle模块序列化与反序列化

模块讲解----json与pickle模块的区别

json与pickle模块

json与pickle模块

python模块(json和pickle模块)

python学习第四十八天json模块与pickle模块差异