如何通过JAVA 读取.wps et及 dps文件格式的内容

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何通过JAVA 读取.wps et及 dps文件格式的内容相关的知识,希望对你有一定的参考价值。

下面是三个java例子,关于读取wps/et/dps的方法

1.读取wps(读取文本): 通过流加载wps文件,读取文字内容

import com.spire.doc.*;

import java.io.File;
import java.io.FileInputStream;
import java.io.FileWriter;
import java.io.IOException;

public class ReadTextFromWPS
public static void main(String[] args) throws IOException
//通过流加载WPS文字文档
FileInputStream inputStream = new FileInputStream(new File("test.wps"));
Document doc = new Document();
doc.loadFromStream(inputStream, FileFormat.Doc);

//获取文本保存为String
String text = doc.getText();

//将String写入Txt
writeStringToTxt(text,"读取WPS文本.txt");

public static void writeStringToTxt(String content, String txtFileName) throws IOException

FileWriter fWriter= new FileWriter(txtFileName,true);
try
fWriter.write(content);
catch(IOException ex)
ex.printStackTrace();
finally
try
fWriter.flush();
fWriter.close();
catch (IOException ex)
ex.printStackTrace();




2. 读取et:直接加载et格式的表格文件,读取数据

import com.spire.xls.*;

public class ExcelToText
public static void main(String[] args)
//加载et格式的表格文件
Workbook workbook = new Workbook();
workbook.loadFromFile("test.et");

//获取工作表
Worksheet sheet = workbook.getWorksheets().get(0);

//获取指定单元格中的文本数据
CellRange range = sheet.getCellRange("A1");
String text = range.getText().trim();
System.out.println(text);


3.读取dps:直接加载dps格式的幻灯片文档,读取文本

import com.spire.presentation.IAutoShape;
import com.spire.presentation.ISlide;
import com.spire.presentation.ParagraphEx;
import com.spire.presentation.Presentation;
import java.io.FileWriter;

public class ExtractText
public static void main(String[]args) throws Exception
//加载测试文档
Presentation ppt = new Presentation();
//ppt.loadFromFile("test.pptx");
ppt.loadFromFile("test.dps");

StringBuilder buffer = new StringBuilder();

//遍历文档中的幻灯片,提取文本
for (Object slide : ppt.getSlides())

for (Object shape : ((ISlide) slide).getShapes())

if (shape instanceof IAutoShape)

for (Object tp : ((IAutoShape) shape).getTextFrame().getParagraphs())

buffer.append(((ParagraphEx) tp).getText());




//保存到文本文件
FileWriter writer = new FileWriter("ExtractTextfromDPS.txt");
writer.write(buffer.toString());
writer.flush();
writer.close();


这里须在Java程序中导入spire.office.jar文件。

参考技术A

    服务器解析的话,有POI或者JExcelApi等方式。

    客户端启动WPS进程解析的话,可以通过JCOM。

本回答被提问者采纳

word对比功能java调用wps

参考技术A 比较两个或多个 Word 文档并突出差异。

本文讨论/涵盖了以下主题:

用于比较 Word 文档的 Java API
使用 Java 比较 Word 文档
使用 Java 获取更改的文本
比较 Word 文档中的书签
用于比较 Word 文档的 Java API
我将使用 GroupDocs.Comparison for Java API 来比较 DOCX 文档。它进行比较以检测单词、段落和字符的内容变化,同时提供列出差异摘要的比较文档。它还使您能够检测相似文档格式之间文本样式的变化和差异。 API 支持比较所有行业标准文档格式,例如 PDF、HTML、Word、Excel、PowerPoint、Outlook 电子邮件、Visio 图表、OpenDocument、AutoCAD 和图像。

以上是关于如何通过JAVA 读取.wps et及 dps文件格式的内容的主要内容,如果未能解决你的问题,请参考以下文章

Java读取.wps后缀名文档的代码?

java如何读取整个excel文件的内容

您好,我想用java代码调用wps?

wps两个表格使用vlookup匹配为啥出现所引用的单元格不能位于256列

如何从 Webview 结束(或网页结束)结束 Webview 300 dps 的滚动? (安卓Java)

java poi 读取excel文件 用wps编辑之后不能读取,只能读取office的