java项目中的文档转换案例实战——Word2003(doc)版本转换为HTML网页

Posted 北溟溟

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了java项目中的文档转换案例实战——Word2003(doc)版本转换为HTML网页相关的知识,希望对你有一定的参考价值。

前言

由于在开发中需要适配不同的多端应用,在文件相关处理中也会存在相同的问题,需要将文档转换为不同的格式展示,本节我们主要通过一个小案例实现在java环境下实现 Word2003(doc)转换为html用于在线展示。

正文

  • 引入word转换为html的pom工具包
<!--word转html https://mvnrepository.com/artifact/org.apache.poi/poi-scratchpad -->
<dependency>
	<groupId>org.apache.poi</groupId>
	<artifactId>poi-scratchpad</artifactId>
	<version>3.17</version>
</dependency>

<!-- https://mvnrepository.com/artifact/org.apache.poi/poi-ooxml -->
<dependency>
	<groupId>org.apache.poi</groupId>
	<artifactId>poi-ooxml</artifactId>
	<version>3.17</version>
</dependency>

<!-- https://mvnrepository.com/artifact/fr.opensagres.xdocreport/fr.opensagres.xdocreport.converter.docx.xwpf -->
<dependency>
	<groupId>fr.opensagres.xdocreport</groupId>
	<artifactId>fr.opensagres.xdocreport.converter.docx.xwpf</artifactId>
	<version>2.0.1</version>
</dependency>

  •  后端转换代码

    @ApiOperation(value = "word2003转换为html")
    @PostMapping(value = "word2003ToHtml")
    public void word2003ToHtml(HttpServletResponse response, @RequestPart("file") MultipartFile file) 
        try 
            InputStream inputStream = file.getInputStream();
            HWPFDocument wordDocument = new HWPFDocument(inputStream);
            WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument());
            wordToHtmlConverter.processDocument(wordDocument);
            Document htmlDocument = wordToHtmlConverter.getDocument();
            response.reset();
            response.setHeader("Content-Disposition", "inline; filename=" + URLEncoder.encode(IdWorker.getIdStr() + ".html", "UTF-8"));
            ServletOutputStream outputStream = response.getOutputStream();
            DOMSource domSource = new DOMSource(htmlDocument);
            StreamResult streamResult = new StreamResult(outputStream);
            TransformerFactory tf = TransformerFactory.newInstance();
            Transformer serializer = tf.newTransformer();
            serializer.setOutputProperty(OutputKeys.ENCODING, "utf-8");
            serializer.setOutputProperty(OutputKeys.INDENT, "yes");
            serializer.setOutputProperty(OutputKeys.METHOD, "html");
            serializer.transform(domSource, streamResult);
            outputStream.flush();
            inputStream.close();
            outputStream.close();
         catch (IOException ioException) 
            ioException.printStackTrace();
         catch (ParserConfigurationException e) 
            e.printStackTrace();
         catch (TransformerException e) 
            e.printStackTrace();
        
    

  • vue前端代码 
<template>
  <div class="container">
    <div class="title">
      <span>Word2003转换Html示例</span>
      <el-divider direction="vertical"></el-divider>
      <router-link to="home">
        <span style="font-size: 18px;">退出</span>
      </router-link>
    </div>
    <el-divider>Test Staring</el-divider>
    <div style="text-align: center;">
      <el-upload
          ref="upload"
          class="upload-demo"
          drag
          :on-success="handlerOnSuccess"
          action="/fileTransfer/word2003ToHtml">
        <i class="el-icon-upload"></i>
        <div class="el-upload__text">将文件拖到此处,或<em>点击上传</em></div>
        <div class="el-upload__tip" slot="tip">只能上传doc文件,且不超过50MB</div>
      </el-upload>
    </div>
  </div>
</template>

<script>
export default 
  name: "Word2003ToHtml",
  data() 
    return 
  ,
  methods: 
    //文件上传成功的回调
    handlerOnSuccess(data, file, fileList) 
      const url = window.URL.createObjectURL(new Blob([data], type: 'text/html'));
      const link = document.createElement('a');
      link.href = url;
      link.setAttribute('download', file.uid+'.html') // 下载文件的名称及文件类型后缀
      document.body.appendChild(link)
      link.click();
      document.body.removeChild(link); // 下载完成移除元素
      window.URL.revokeObjectURL(url); // 释放掉blob对象
    
  

</script>

<style scoped lang="scss">
.container 
  padding: 10px;

  .title 
    font-size: 20px;
    font-weight: bold;
  

</style>

  • 验证结果

结语

ok,本节内容到这里就结束了,我们下期见。。。。。。

以上是关于java项目中的文档转换案例实战——Word2003(doc)版本转换为HTML网页的主要内容,如果未能解决你的问题,请参考以下文章

java项目中的文档转换案例实战——Word转换为PDF

java项目中的文档转换案例实战——Word2007版本转换为HTML网页

java项目中的文档转换案例实战——Word2003(doc)版本转换为HTML网页

java项目中的文档转换案例实战——Word2003(doc)版本转换为HTML网页

java项目中的文档转换案例实战——PDF转换为网页HTML

java项目中的文档转换案例实战——PDF转换为JPG图片压缩包