python解压zip包中文乱码解决方式
Posted 泽州
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python解压zip包中文乱码解决方式相关的知识,希望对你有一定的参考价值。
乱码得原因:
由于ZipFile模块导出遇到中文解码不对,windows上会出现,linux是否会出现不知道没测试过。
解决方式:
1. 搞个文件名引射表(不太方便,少量文件夹套用时候还可以)
2. 修改源码解码格式(不太方便,自己搞了一下,之后报其他错误)
3. 自己写入文件,自己创建文件夹(推荐)
自己创建的写法:
with zipfile.ZipFile(file=zip_save_path, mode=\'r\') as zf: # 解压到指定目录,首先创建一个解压目录 os.mkdir(unzip_dir_path) for old_name in zf.namelist(): # 获取文件大小,目的是区分文件夹还是文件,如果是空文件应该不好用。 file_size = zf.getinfo(old_name).file_size # 由于源码遇到中文是cp437方式,所以解码成gbk,windows即可正常 new_name = old_name.encode(\'cp437\').decode(\'gbk\') # 拼接文件的保存路径 new_path = os.path.join(unzip_dir_path, new_name) # 判断文件是文件夹还是文件 if file_size > 0: # 是文件,通过open创建文件,写入数据 with open(file=new_path, mode=\'wb\') as f: # zf.read 是读取压缩包里的文件内容 f.write(zf.read(old_name)) else: # 是文件夹,就创建 os.mkdir(new_path)
结果正常:
以上是关于python解压zip包中文乱码解决方式的主要内容,如果未能解决你的问题,请参考以下文章