Python批量读取加密Word文档转存txt文本实现

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python批量读取加密Word文档转存txt文本实现相关的知识,希望对你有一定的参考价值。

参考技术A # -*- coding:utf-8 -*-

from win32com import client as wc

import os

key = '文档密码'

def Translate(input, output):

# 转换

wordapp = wc.Dispatch('Word.Application')

try:

doc = wordapp.Documents.Open(input, False, False, False,key)

doc.SaveAs(FileName=output, FileFormat=4, Encoding="gb2312")

doc.Close()

print(input, "完成")

os.remove(input)

# 为了让python可以在后续操作中r方式读取txt和不产生乱码,参数为4

except:

print(input,"密码错误")

if __name__ == '__main__':

#docx文档物理路径

path = r"C:Usersdocx"

key = '文档密码'

j=0

for file in os.listdir(path):

if '.doc' in file:

name = file.split(".docx")[0]

#输入文档物理路径

input_file = r"C:Usersdocx"+""+file

#输出文档物理路径

output_file=r"C:Users xt"+""+name+".txt"

Translate(input_file, output_file)

j=j+1

print(j)

else:continue

以上是关于Python批量读取加密Word文档转存txt文本实现的主要内容,如果未能解决你的问题,请参考以下文章

如何批量的把WORD文件变为TXT文件???

批量转换word文档到pdf文件

Python批量提取docx格式Word文档中所有文本框内的文本

python读取word文档,插入mysql数据库实例

java读取多个txt文件内容,并按照文件名称排序

采集txt文本/word文档中邮箱地址的python小工具