java中怎么实现读取word.doc文档分辨标题,文号,签发日期等信息

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了java中怎么实现读取word.doc文档分辨标题,文号,签发日期等信息相关的知识,希望对你有一定的参考价值。

用模板,设置一些标签,对应你要读的字段,poi读对应标签内容就可以解析出来。
要求填写字段的时候,把字段填写的对应标签中,一般是编程实现。。如果用户自己做的不行。追问

word是用户上传上来的,样式不是很固定。怎么弄模版。不知道怎么分类数据
最后写入到xml中,但是标题,文号,发布公文的单位和日期要怎么往xml里存。

.doc格式

参考技术A 有没有实现这个功能亲 ,我现在也有这块的需求

以上是关于java中怎么实现读取word.doc文档分辨标题,文号,签发日期等信息的主要内容,如果未能解决你的问题,请参考以下文章

Java Apache POI 读取 Word (.doc) 文件并获取使用的命名字符样式

在 Java 中以编程方式将 Word doc 转换为 HTML

在 Asp.net 中通过 Word doc 自动填写 Web 表单

使用olefile从Word .doc中提取文本

从excel VBA转到word doc中的特定行

在没有 Microsoft.Office.Interop 的 .NET Core 中将 Word doc 和 docx 格式转换为 PDF