word文档为啥JAVA流不能直接读取,像WORD,EXCEL这样的文件都要通过第三方的API来读写,在J2SE中怎么做

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了word文档为啥JAVA流不能直接读取,像WORD,EXCEL这样的文件都要通过第三方的API来读写,在J2SE中怎么做相关的知识,希望对你有一定的参考价值。

比方说我想将几个word合并成一个,直接用J2SE的API怎么做,谢谢

参考技术A java不能直接处理第三方文件格式的数据,建议用Tika,或者POI。
Apache Tika是一个内容抽取的工具集合。用来通过现有的解析器库检测以及从各种文档提取元数据以及结构化的文本内容。
它集成了POI, Pdfbox 并且为文本抽取工作提供了一个统一的界面。其次,Tika也提供了便利的扩展API,用来丰富其对第三方文件格式的支持。
参考技术B j2se无法直接处理word,因为word是特殊格式的文档,java无法直接处理。
只能通过第三方的API来处理。
参考技术C word文档是微软的。java现在是oracle的。不是一个公司,不可能像VB那样容易的操作。
J2SE里面要要用第三方的jar包。参考: poi (http://poi.apache.org/)
参考技术D 这个有点难办,
可以用poi或其他的api来做,
实际上底层还是用流读取的
但是要熟悉word的格式
知道读取出来的东西怎么转换
这个就不容易了本回答被提问者采纳

你好,问一下java能不能读取word中指定位置的内容,比如书签的内容。

当然可以阿,你用这个java.io.RandomAccessFile raf=new RandomAccessFile("文件路径和名字","rw"); raf.seek("指定位置的偏移量"); 参考技术A 可以啊

以上是关于word文档为啥JAVA流不能直接读取,像WORD,EXCEL这样的文件都要通过第三方的API来读写,在J2SE中怎么做的主要内容,如果未能解决你的问题,请参考以下文章

java读取word内容并保留格式

java读取word文件的内容

python 不能read word文件?

你好,问一下java能不能读取word中指定位置的内容,比如书签的内容。

MacBook Air为啥word文档里面为啥不能切换中文输入法打中文?

为啥java 用IO流读docx文件里的内容打印在控制台是乱码