用JAVA能把Word和PDF文档的表格内容和格式识别出来吗
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了用JAVA能把Word和PDF文档的表格内容和格式识别出来吗相关的知识,希望对你有一定的参考价值。
我用Python只能把表格中的文字识别出来,但是格式全丢了,用JAVA能做到吗,就是让我能知道一句话在表格的第几行第几列
参考技术A java的poi插件可以读取word文件。怎样能把word文档的内容上传网站
参考技术A 可以弄个插件,把上传的word,自动整理为网页形式的。在word文档中编辑一篇文章,格式段落都整理好后,粘贴到dede编辑器里面却发现,格式都无效了,可能dede有自己的打算,比如这样可以文章字体大小统一,样色统一,整体比较整洁。但是用惯了word编辑文章的同学们就感觉不顺手了。郑州亿仟家网络经过查资料和实际操作,把方法给大家介绍一下。Dedecms集成的是CKEditor编辑器,我们要做的是把CKEditor编辑器替换成kindeditor编辑器,kindeditor编辑器以其强大的功能和良好的用户体验度,是目前国内使用最广泛的编辑器之一。
具体操作步骤如下:
1,首先下载kindeditor文件包,下载地址:/uploads/file/20130430/20130430105608_10173.zip
2,解压后把kindeditor文件夹上传到include/目录下。
3,用kindeditor文件夹下的inc_fun_funAdmin.php替换include/inc/下的inc_fun_funAdmin.php文件。
4,修改dedecms系统参数——核心设置——Html编辑器(ckeditor,需要fck的用户可以去官网下载):将ckeditor改成kindEditor。
以上是关于用JAVA能把Word和PDF文档的表格内容和格式识别出来吗的主要内容,如果未能解决你的问题,请参考以下文章