aspose.word 怎么把word里的章节分别取出来

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了aspose.word 怎么把word里的章节分别取出来相关的知识,希望对你有一定的参考价值。

参考技术A Document doc = new Document(attchmentPath);
string str=doc.GetText();

只知道保存html 或pdf时能把图片导出来.........
private string ReadWord(string path)

Document doc = new Document(path);

using (MemoryStream ms = new MemoryStream())

doc.SaveOptions.HtmlExportImagesFolder= "temp/"; //debug下建个temp目录用于存图片。
doc.Save(ms, SaveFormat.Html);
string text = Encoding.UTF8.GetString(ms.ToArray());
ms.Close();
return text;

本回答被提问者和网友采纳

Linux环境aspose插件word转pdf中文乱码解决方案



目录


1 问题描述

在centos服务器使用aspose.word转换word文件为pdf的时候显示中文乱码,但是在win服务器上使用可以正常转换。

Linux环境aspose插件word转pdf中文乱码解决方案_centos

2 问题原因

通过查资料分析后确认是由于linux服务器缺少对应的字库导致文件转换出现乱码的。

3 解决方案1:环境解决

安装字库,将win机器的c:\\windows\\fonts目录下的全部文件拷贝到生产服务器字体安装目录下,然后执行以下命令更新字体缓存。

Linux环境aspose插件word转pdf中文乱码解决方案_linux_02

查看linux目前的所有字体

fc-list

查看Linux目前的所有中文字体

fc-list :lang=zh

拷贝到linux下的字体目录

mkdir /usr/share/fonts/win
cp /local/src/fonts/* /usr/share/fonts/win

执行安装字体命令

cd /usr/share/fonts
sudo mkfontscale
sudo mkfontdir
sudo fc-cache -fv

执行命令让字体生效

source /etc/profile

如果安装失败,可以考虑修改字体权限

chmod 755 *.ttf

4 解决方案2:代码解决

1.将window中字体放到linux中,上传至/usr/shared/fonts/chinese目录下,接下里用

2.在aspose代码中添加

@SneakyThrows
public static void wordToPdf(String wordPath, String pdfPath)
getLicense();
File file = new File(pdfPath);
try (FileOutputStream os = new FileOutputStream(file))
OsInfo osInfo = SystemUtil.getOsInfo();
if(osInfo.isLinux())
FontSettings.setFontsFolder("/usr/share/fonts/chinese", true);

Document doc = new Document(wordPath);
doc.save(os, SaveFormat.PDF);

3.重启服务



以上是关于aspose.word 怎么把word里的章节分别取出来的主要内容,如果未能解决你的问题,请参考以下文章

利用Aspose.Word控件实现Word文档的操作

黄聪:利用Aspose.Word控件实现Word文档的操作(转)

aspose.word使用简单方法

关于ASPOSE.WORD使用上的一个小问题

Aspose Word模板使用总结

word 索引是啥意思,怎么用?