java读取word内容并保留格式
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了java读取word内容并保留格式相关的知识,希望对你有一定的参考价值。
如题,我要读取一个word文件并且要保留其中的文件格式,比如红头文件、表格等,然后输出,我试了一下poi貌似不能保留格式啊。
如果是不处理分页的情况下,用poi可以直接处理,IE有自带的处理JS,直接调用就可以;如果有分页情况出现,但是为了导出的word又要是全部数据,这个建议自己写导出的java类 参考技术A 你好,我也遇到了这个问题,我想问一下你这个问题解决了吗,怎么办呀!谢谢指导在网页编辑器中粘贴时如何保留WORD中的表格
参考技术A 即可既去除Word多余的代码,同时保留Word
中的一些样式,如表格等。
操作方法:1、进入SiteFactory
系统后台,在添加信息的管理界面中,可以看到“从
MS
Word
粘贴”功能按钮:
2、从Word
中复制相关内容后,单击“从
MS
Word
粘贴”功能按钮,在出现的窗口中使用键
盘快捷键“Ctrl+V”,将Word
中复制的内容粘贴到窗口的内容框中,同时勾选下方“忽略Font
标签”和“清理CSS
样式”复选框后,单击“确定”按钮:
3、在编辑器内容框中,即可看到表格格式已经被保留了:2
4、单击编辑器底部“源代码”按钮,即可查看到上述源代码比较简洁:
利用“从
MS
Word
粘贴”功能按钮后的源代码:3
直接将Word
中的内容粘贴到编辑器中的源代码:4
击“是”系统则自动出现上述清除格式窗口以方便直接操作:
前台效果:动易技术中心使用的是SiteWeaver,SiteWeaver
也有从Word
中粘贴功能按钮,
但不能保留表格等样式。我们可以利用SiteFactory
中的这个功能得到相关代码,再将代码复制
到SiteWeaver
中即可。技术中心SiteFactory
CMS
说明手册
>>
内置标签说明
中的文章都是这样操作的:5
的不同。这是因为在动易技术中心的CSS
样式中,单独对文章内容页中的表格进行了定义:
.Tech_Article
dd.Articlecontent
table
border-collapse:collapse;
.Tech_Article
dd.Articlecontent
td
border:
1px
solid
#5E93B9;
padding:
2px;
font:
normal
normal
normal
12px/150%
Arial,
"宋体"
,Helvetica,sans-serif;其中:border-collapse:collapse;:定义将表格的行和单元格的边合并在一起(不定义则默认为标
准的HTML
样式分开)。
border:
1px
solid
#5E93B9;:定义单元格的边线为一个像素蓝色实线边框。
padding:
2px;:定义单元格的内边距。
利用这个方法,一方面可以去除因从Word
中直接粘贴而产生的大量的无用代码,减少网页的
代码量,另一方面可以避免从Word
中直接粘贴时因格式对文字造成的分隔,避免在进行站内搜索
以上是关于java读取word内容并保留格式的主要内容,如果未能解决你的问题,请参考以下文章
怎么用Java读取word文档里的内容格式信息,比如标题字体,颜色和段间距啥的?