python 如何识别docx中的公式

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 如何识别docx中的公式相关的知识,希望对你有一定的参考价值。

参考技术A import fnmatch, os, sys, win32com.client

readpath=r'D:\123'

wordapp = win32com.client.gencache.EnsureDispatch("Word.Application")
try:
for path, dirs, files in os.walk(readpath):
for filename in files:
if not fnmatch.fnmatch(filename, '*.docx'):continue
doc = os.path.abspath(os.path.join(path,filename))
print 'processing %s...' % doc
wordapp.Documents.Open(doc)
docastext = doc[:-4] + 'txt'
wordapp.ActiveDocument.SaveAs(docastext,FileFormat=win32com.client.constants.wdFormatText)
wordapp.ActiveDocument.Close()
finally:
wordapp.Quit()
print 'end'

f=open(r'd:\123\test.txt','r')
for line in f.readlines():
print line.decode('gbk')
f.close()追问

谢谢,在linux环境下,这样可以用吗?不能的话,用什么方法可以做到?

本回答被提问者和网友采纳

如何设置表格中的行高以在 python-docx 中修复?

【中文标题】如何设置表格中的行高以在 python-docx 中修复?【英文标题】:How can I set row height in a table to be fixed in python-docx? 【发布时间】:2017-06-19 09:13:03 【问题描述】:

我正在尝试使用文档中的此示例将行高设置为固定值。

http://python-docx.readthedocs.io/en/latest/dev/analysis/features/table/table-row.html?highlight=table#row-height

(链接中断时的内容)

>>> from docx.enum.table import WD_ROW_HEIGHT
>>> row = table.add_row()
>>> row
<docx.table._Row object at 0x...>
>>> row.height_rule
None
>>> row.height_rule = WD_ROW_HEIGHT.EXACTLY
>>> row.height
None
>>> row.height = Pt(24)

但是,我无法从 docx.enum.table 导入 WD_ROW_HEIGHT,出现此错误:

Traceback (most recent call last):
  File "C:/Users/Calderdale NUT/Google Drive/CDFU/Membership Python/labels test.py", line 2, in <module>
    from docx.enum.table import WD_ROW_HEIGHT
ImportError: cannot import name 'WD_ROW_HEIGHT'

查看源码,table.py 文件在那里,但只有WD_TABLE_ALIGNMENTWD_TABLE_DIRECTION 在里面。

我的 python-docx 版本是 0.8.6

【问题讨论】:

【参考方案1】:

您提到的链接实际上是未来的功能(即尚未实现)。

【讨论】:

这完美地回答了我的问题。如果有任何关于何时实施的想法会很有用,但我意识到可能没有。

以上是关于python 如何识别docx中的公式的主要内容,如果未能解决你的问题,请参考以下文章

在 python-docx 中,如何删除表格行?

使用 python-docx 突出显示 docx 文件中的段落

python-docx 插入点

神器!PDF转成可编辑的MarkdownLaTex,数学公式Mathpix Snip

神器!PDF转成可编辑的MarkdownLaTex,数学公式Mathpix Snip

Python如何操作word文档,Python-docx类库的使用