Python 将一个目录下的所有word文档转为txt

Posted 文竹balala

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python 将一个目录下的所有word文档转为txt相关的知识,希望对你有一定的参考价值。

需要下载安装win32com,并且注意要和你的python版本和32bit or 64bit一致


#!D:\\\\My Python\\\\Trans_to_txt.py
#注意Windows下路径表示 
from win32com import client as wc
import os


print('Enter your Director\\'s path:')
mypath = input()
all_FileNum = 0

def Translate(level, path):
    global all_FileNum
    '''
    将一个目录下所有doc文件转成txt
    '''
    #该目录下所有文件的名字
    files = os.listdir(path)
    for f in files:
        if (f[0] == '~' or f[0] == '.'):
            continue
        new = path + '\\\\\\\\' + f
        print(new)
        #除去后边的.doc后缀
        tmp = new[:-4]
        #改成txt格式
        word = wc.Dispatch('Word.Application')
        doc = word.Documents.Open(tmp)
        doc.SaveAs(tmp + '.txt', 4)
        doc.Close()
        all_FileNum = all_FileNum + 1
if __name__ == '__main__':
    Translate(1, mypath)
    print('文件总数 = ', all_FileNum)





以上是关于Python 将一个目录下的所有word文档转为txt的主要内容,如果未能解决你的问题,请参考以下文章

python自动化与文档处理(word, excel, html)3个小程序

批量转换word文档到pdf文件

python 将一个目录下word转为txt第三版

将word怎么转化html

怎么将HTML文档转换为Word文档?

C# 将Word转为PDF时,设置PDF文档保护