如何用程序实现将word文件转换成txt纯文本文件

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何用程序实现将word文件转换成txt纯文本文件相关的知识,希望对你有一定的参考价值。

打开需要转换的文件,我这里随手写一份做演示,使用的 word版本是2010版,如图:

我们来转换为txt格式,点击菜单"文件"->"另存为",然后在弹出的对话框中,选择"纯文本",然后保存,如图:

然后,它会弹出一个编码选择对话框,并提示我们文件中有包含无法显示的字符,
因为默认导出的是文本编码为"GB2312",它只包含了常用的汉字及标点,不包含好多unicode字符,文本中的心形符号"♠"就是一个UNICODE字符,所以,会以红色显示并提醒,如图:

因此我们需要选择另外的编码方式,点击上面的"其他编码",然后右侧的编码列表会变成可用状态,然后查找到"Unicode(UTF-8)"这个选项,如图,显示就正确了:

然后确定选择,再用记事本打开文件,如图,显示是正常的:

假如使用的是GB2312的编码方式的话,上面的"♠"会显示为"?"号,如图:

另一种办法是直接复制word文件的内容,然后粘贴到记事本中,保存时要选择为utf-8,如图,其它操作相似,限于篇幅,不再一下示范:
参考技术A 点文件,另存为,在文件类型中找TXT格式,保存即可。

以上是关于如何用程序实现将word文件转换成txt纯文本文件的主要内容,如果未能解决你的问题,请参考以下文章

如何用纯java代码实现word转pdf

如何用c++语言将word转换成图片?

怎么把word文档转换成文本文档?

PHP将网页内容转换为纯文本文件并保存为TXT

word文件显示乱码怎么办?

如何用Java实现将word里的表格数据写入到excel中去