python解压zip包中文乱码解决方式

Posted 泽州

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python解压zip包中文乱码解决方式相关的知识,希望对你有一定的参考价值。

 

乱码得原因:

由于ZipFile模块导出遇到中文解码不对,windows上会出现,linux是否会出现不知道没测试过。

 

解决方式:

1. 搞个文件名引射表(不太方便,少量文件夹套用时候还可以)

2. 修改源码解码格式(不太方便,自己搞了一下,之后报其他错误)

3. 自己写入文件,自己创建文件夹(推荐)

 

自己创建的写法:

        with zipfile.ZipFile(file=zip_save_path, mode=\'r\') as zf:
            # 解压到指定目录,首先创建一个解压目录
            os.mkdir(unzip_dir_path)
            for old_name in zf.namelist():
                # 获取文件大小,目的是区分文件夹还是文件,如果是空文件应该不好用。
                file_size = zf.getinfo(old_name).file_size
                # 由于源码遇到中文是cp437方式,所以解码成gbk,windows即可正常
                new_name = old_name.encode(\'cp437\').decode(\'gbk\')
                # 拼接文件的保存路径
                new_path = os.path.join(unzip_dir_path, new_name)
                # 判断文件是文件夹还是文件
                if file_size > 0:
                   # 是文件,通过open创建文件,写入数据
                    with open(file=new_path, mode=\'wb\') as f:
                        # zf.read 是读取压缩包里的文件内容
                        f.write(zf.read(old_name))
                else:
                    # 是文件夹,就创建
                    os.mkdir(new_path)

结果正常:

 

以上是关于python解压zip包中文乱码解决方式的主要内容,如果未能解决你的问题,请参考以下文章

解决 centos下附件 zip文件解压乱码问题

zip压缩包解压乱码问题

Linux 下 zip 文件解压乱码如何解决?

linux解压zip包,文件名中文乱码

linux解压zip包,文件名中文乱码

linux解压zip包,文件名中文乱码