19-json与pickle模块
Posted Jil-Menzerna
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了19-json与pickle模块相关的知识,希望对你有一定的参考价值。
一、json模块
1.1 什么是序列化&反序列化
内存中的数据类型---->序列化---->特定的格式(json格式或者pickle格式)
内存中的数据类型<----反序列化<----特定的格式(json格式或者pickle格式)
土办法:
{\'aaa\':111}--->序列化str({\'aaa\':111})----->"{\'aaa\':111}"
{\'aaa\':111}<---反序列化eval("{\'aaa\':111}")<-----"{\'aaa\':111}"
1.2 为何要序列化
序列化得到结果=>特定的格式的内容有两种用途
1、可用于存储=》用于存档
2、传输给其他平台使用=》跨平台数据交互
python java
列表 特定的格式 数组
强调:
针对用途1的特定一格式:可是一种专用的格式=》pickle只有python可以识别
针对用途2的特定一格式:应该是一种通用、能够被所有语言识别的格式=》json
1.3 如何序列化与反序列化
# 示范1 import json # 序列化 json_res=json.dumps([1,\'aaa\',True,False]) print(json_res,type(json_res)) # "[1, "aaa", true, false]" # # 反序列化 l=json.loads(json_res) print(l,type(l))
1、序列化写入文件
import json # 序列化的结果写入文件的复杂方法 json_res=json.dumps([1,\'aaa\',True,False]) # print(json_res,type(json_res)) # "[1, "aaa", true, false]" with open(\'test.json\',mode=\'wt\',encoding=\'utf-8\') as f: f.write(json_res) # 将序列化的结果写入文件的简单方法 with open(\'test.json\',mode=\'wt\',encoding=\'utf-8\') as f: json.dump([1,\'aaa\',True,False],f)
2、反序列化读取文件
# 从文件读取json格式的字符串进行反序列化操作的复杂方法 with open(\'test.json\',mode=\'rt\',encoding=\'utf-8\') as f: json_res=f.read() l=json.loads(json_res) print(l,type(l)) # 从文件读取json格式的字符串进行反序列化操作的简单方法 with open(\'test.json\',mode=\'rt\',encoding=\'utf-8\') as f: l=json.load(f) print(l,type(l))
1.4 json格式
1、json格式不可与python混淆,str为双引号。
2、json中只有以上格式,不能识别某一语言所独有的类型。
import json # json验证: json格式兼容的是所有语言通用的数据类型,不能识别某一语言的所独有的类型 # json.dumps({1,2,3,4,5}) # error: Object of type set is not JSON serializable # json强调:一定要搞清楚json格式,不要与python混淆 l=json.loads(\'[1, "aaa", true, false]\') # corroct l=json.loads("[1,1.3,true,\'aaa\', true, false]") # error:json.decoder.JSONDecodeError: Expecting value: line 1 column 13 (char 12) print(l[0])
3、json在python3.5以后,可以识别bytes类型,但只可读,不可写。(wb模式下,不可直接使用 json.dump(user_dict,f),其内部会将user_dict转换成str再写入,而此时系统分配的文件权限是b模式)
4、在json中出现中文,会以Unicode的二进制编码以字符串类型存入
l = json.loads(b\'[1, "aaa", true, false]\') print(l, type(l)) # with open(\'test.json\',mode=\'rb\') as f: l=json.load(f) res=json.dumps({\'name\':\'哈哈哈\'}) print(res,type(res)) # {"name": "\\u54c8\\u54c8\\u54c8"} <class \'str\'> res=json.loads(\'{"name": "\\u54c8\\u54c8\\u54c8"}\') print(res,type(res)) # {\'name\': \'哈哈哈\'} <class \'dict\'>
1.5 猴子补丁
在入口处打猴子补丁,不用改原代码,也无须在子文件中处处改为 import ujson as json
# 在入口处打猴子补丁 import json import ujson def monkey_patch_json(): json.__name__ = \'ujson\' json.dumps = ujson.dumps json.loads = ujson.loads monkey_patch_json() # 在入口文件出运行
二、pickle 模块
内存中的数据类型---->序列化---->特定的格式(json格式或者pickle格式)
内存中的数据类型<----反序列化<----特定的格式(json格式或者pickle格式)
pickle为python可识别的,且无类型限制。
import pickle dic={\'name\':\'alvin\',\'age\':23,\'sex\':\'male\'} print(type(dic))#<class \'dict\'> j=pickle.dumps(dic) print(type(j))#<class \'bytes\'> f=open(\'序列化对象_pickle\',\'wb\')#注意是w是写入str,wb是写入bytes,j是\'bytes\' f.write(j) #-------------------等价于pickle.dump(dic,f) f.close() #-------------------------反序列化 import pickle f=open(\'序列化对象_pickle\',\'rb\') data=pickle.loads(f.read())# 等价于data=pickle.load(f) print(data[\'age\'])
python2 python3 兼容性问题
# coding:utf-8 import pickle with open(\'a.pkl\',mode=\'wb\') as f: # 一:在python3中执行的序列化操作如何兼容python2 # python2不支持protocol>2,默认python3中protocol=4 # 所以在python3中dump操作应该指定protocol=2 pickle.dump(\'你好啊\',f,protocol=2) with open(\'a.pkl\', mode=\'rb\') as f: # 二:python2中反序列化才能正常使用 res=pickle.load(f) print(res) python2与python3的pickle兼容性问题
三、XML
现在已逐渐被淘汰,详细可参照这篇博客:https://www.cnblogs.com/linhaifeng/articles/6384466.html#_label8
以上是关于19-json与pickle模块的主要内容,如果未能解决你的问题,请参考以下文章