java word 转html 的两种方法

Posted ISaiSai

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了java word 转html 的两种方法相关的知识,希望对你有一定的参考价值。

1. 依赖aspose(需要收费,有水印)

    <repositories>
        <repository>
            <id>AsposeJavaAPI</id>
            <name>Aspose Java API</name>
            <url>https://repository.aspose.com/repo/</url>
        </repository>
    </repositories>

    <dependencies>

        <dependency>
            <groupId>com.aspose</groupId>
            <artifactId>aspose-words</artifactId>
            <version>21.10</version>
            <type>pom</type>
        </dependency>
</dependencies>

      
        com.aspose.words.Document doc = new com.aspose.words.Document();
        ByteArrayOutputStream byteArrayOutputStream = new ByteArrayOutputStream();
        htmlSaveOptions saveOptions = new HtmlSaveOptions();
        saveOptions.setSaveFormat(SaveFormat.HTML);
        saveOptions.setEncoding(StandardCharsets.UTF_8);
        saveOptions.setExportImagesAsBase64(true);
        saveOptions.setExportDocumentProperties(false);
        doc.save(byteArrayOutputStream, saveOptions);
        System.out.println(byteArrayOutputStream.toString());

2. 依赖fr.opensagres.xdocreport

免费,但是依赖poi-ooxml 3.10-FINAL 版本较低,会与其他高版本包冲突

<dependency>
            <groupId>fr.opensagres.xdocreport</groupId>
            <artifactId>fr.opensagres.xdocreport.document</artifactId>
            <version>1.0.5</version>
        </dependency>
        <dependency>
            <groupId>fr.opensagres.xdocreport</groupId>
            <artifactId>org.apache.poi.xwpf.converter.xhtml</artifactId>
            <version>1.0.5</version>
        </dependency>
   InputStream in = new FileInputStream(f);
                XWPFDocument document = new XWPFDocument(in);

                // 2) 解析 XHTML配置 (这里设置IURIResolver来设置图片存放的目录)
                XHTMLOptions options = XHTMLOptions.create();
                options.setIgnoreStylesIfUnused(false);
                options.setFragment(true);

                // 3) 将 XWPFDocument转换成XHTML
                OutputStream out = new FileOutputStream(new File(filepath + htmlName));
                XHTMLConverter.getInstance().convert(document, out, options);

                ByteArrayOutputStream baos = new ByteArrayOutputStream();
                XHTMLConverter.getInstance().convert(document, baos, options);
                String content = baos.toString();
                System.out.println(content);
                baos.close();

以上是关于java word 转html 的两种方法的主要内容,如果未能解决你的问题,请参考以下文章

java word 转html 的两种方法

xml转json的两种方法

Java List集合转数组的两种重载方法

Java跳转页面的两种方法以及它们的区别

Java实现Excel转PDF的两种方法总结

Java实现Excel转PDF的两种方法总结