java word 转html 的两种方法
Posted ISaiSai
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了java word 转html 的两种方法相关的知识,希望对你有一定的参考价值。
1. 依赖aspose(需要收费,有水印)
<repositories>
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.10</version>
<type>pom</type>
</dependency>
</dependencies>
com.aspose.words.Document doc = new com.aspose.words.Document();
ByteArrayOutputStream byteArrayOutputStream = new ByteArrayOutputStream();
htmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.setSaveFormat(SaveFormat.HTML);
saveOptions.setEncoding(StandardCharsets.UTF_8);
saveOptions.setExportImagesAsBase64(true);
saveOptions.setExportDocumentProperties(false);
doc.save(byteArrayOutputStream, saveOptions);
System.out.println(byteArrayOutputStream.toString());
2. 依赖fr.opensagres.xdocreport
免费,但是依赖poi-ooxml 3.10-FINAL 版本较低,会与其他高版本包冲突
<dependency>
<groupId>fr.opensagres.xdocreport</groupId>
<artifactId>fr.opensagres.xdocreport.document</artifactId>
<version>1.0.5</version>
</dependency>
<dependency>
<groupId>fr.opensagres.xdocreport</groupId>
<artifactId>org.apache.poi.xwpf.converter.xhtml</artifactId>
<version>1.0.5</version>
</dependency>
InputStream in = new FileInputStream(f);
XWPFDocument document = new XWPFDocument(in);
// 2) 解析 XHTML配置 (这里设置IURIResolver来设置图片存放的目录)
XHTMLOptions options = XHTMLOptions.create();
options.setIgnoreStylesIfUnused(false);
options.setFragment(true);
// 3) 将 XWPFDocument转换成XHTML
OutputStream out = new FileOutputStream(new File(filepath + htmlName));
XHTMLConverter.getInstance().convert(document, out, options);
ByteArrayOutputStream baos = new ByteArrayOutputStream();
XHTMLConverter.getInstance().convert(document, baos, options);
String content = baos.toString();
System.out.println(content);
baos.close();
以上是关于java word 转html 的两种方法的主要内容,如果未能解决你的问题,请参考以下文章