python 不能read word文件?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 不能read word文件?相关的知识,希望对你有一定的参考价值。

怎么读取.docx的文件,自动删除里面的某句话

参考技术A WORD文件有专门的格式,你当然不可能像文本文件一样读写,你这样打开只能看到一堆乱码。
Python本身没有这个功能,修改WORD文件的话Windows有专门的API,在Office开发套件里面,你用Python调用相关的库才能实现你想要的功能。
参考技术B

以前有过类似的问题 可以参考下:

http://www.cnblogs.com/dudumiaomiao/p/7241933.html

python怎么提取出文件里的指定内容

python读取文件内容的方法:

一.最方便的方法是一次性读取文件中的所有内容并放置到一个大字符串中:

all_the_text = open('thefile.txt').read( )
# 文本文件中的所有文本
all_the_data = open('abinfile','rb').read( )
# 二进制文件中的所有数据

为了安全起见,最好还是给打开的文件对象指定一个名字,这样在完成操作之后可以迅速关闭文件,防止一些无用的文件对象占用内存。举个例子,对文本文件读取:

file_object = open('thefile.txt')
try:
all_the_text = file_object.read( )
finally:
file_object.close( )

不一定要在这里用Try/finally语句,但是用了效果更好,因为它可以保证文件对象被关闭,即使在读取中发生了严重错误。

二.最简单、最快,也最具Python风格的方法是逐行读取文本文件内容,并将读取的数据放置到一个字符串列表中:list_of_all_the_lines = file_object.readlines( )

这样读出的每行文本末尾都带有"\\n"符号;如果你不想这样,还有另一个替代的办法,比如:
list_of_all_the_lines = file_object.read( ).splitlines( )
list_of_all_the_lines = file_object.read( ).split('\\n')
list_of_all_the_lines = [L.rstrip('\\n') for L in file_object]

1、Python 

Python(英语发音:/ˈpaɪθən/), 是一种面向对象、解释型计算机程序设计语言,由Guido van Rossum于1989年底发明,第一个公开发行版发行于1991年,Python 源代码同样遵循 GPL(GNU General Public License)协议。

2、基本概念

Python(KK 英语发音:/'paɪθɑn/, DJ 英语发音:/ˈpaiθən/)是一种面向对象、直译式计算机程序设计语言,由Guido van Rossum于1989年底发明。

参考技术A   python读取文件内容的方法:
  一.最方便的方法是一次性读取文件中的所有内容并放置到一个大字符串中:
  all_the_text = open('thefile.txt').read( )
  # 文本文件中的所有文本
  all_the_data = open('abinfile','rb').read( )
  # 二进制文件中的所有数据
  为了安全起见,最好还是给打开的文件对象指定一个名字,这样在完成操作之后可以迅速关闭文件,防止一些无用的文件对象占用内存。举个例子,对文本文件读取:
  file_object = open('thefile.txt')
  try:
  all_the_text = file_object.read( )
  finally:
  file_object.close( )
  不一定要在这里用Try/finally语句,但是用了效果更好,因为它可以保证文件对象被关闭,即使在读取中发生了严重错误。
  二.最简单、最快,也最具Python风格的方法是逐行读取文本文件内容,并将读取的数据放置到一个字符串列表中:
  list_of_all_the_lines = file_object.readlines( )
  这样读出的每行文本末尾都带有"\n"符号;如果你不想这样,还有另一个替代的办法,比如:
  list_of_all_the_lines = file_object.read( ).splitlines( )
  list_of_all_the_lines = file_object.read( ).split('\n')
  list_of_all_the_lines = [L.rstrip('\n') for L in file_object]
  最简单最快的逐行处理文本文件的方法是,用一个简单的for循环语句:
  for line in file_object:
  process line
  这种方法同样会在每行末尾留下"\n"符号;可以在for循环的主体部分加一句:
  lineline = line.rstrip('\n')
  或者,你想去除每行的末尾的空白符(不只是'\n'\),常见的办法是:
  lineline = line.rstrip( )本回答被提问者采纳

以上是关于python 不能read word文件?的主要内容,如果未能解决你的问题,请参考以下文章

Python三国演义词频统计

Python:读取 .doc.docx 两种 Word 文件简述及“Word 未能引发事件”错误

如何在 Linux 上使用 Python 读取 word 文件信息

如何用JavaScript打开WORD写入文本

Python:读取两种Word文件简述及文件未能引发事件错误

word文档为啥JAVA流不能直接读取,像WORD,EXCEL这样的文件都要通过第三方的API来读写,在J2SE中怎么做