C# 怎么处理Word文件的乱码

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了C# 怎么处理Word文件的乱码相关的知识,希望对你有一定的参考价值。

用文件流操作时,读取word文件的内容到string变量,结果变量的值全是乱码,求大侠指教,该如何把乱码转为中文?

Word文件本身是二进制数据,不能用读取文本文件的方式去处理。

可以考虑的解决思路:
* 将Word的Interop库(Microsoft.Office.Interop.Word.dll)加入你项目的引用,利用Word的对象模型来获取你想要的图文内容。优点是开发简单,缺点是程序运行效率低(Word的对象模型比较慢)。

* 如果Word是97及之前版本,可以通过分析Word文档的二进制文件格式(网上可以找到)来获取需要的信息。优点是程序效率高,缺点是开发难度相当大。

* 如果Word是2007及之后版本,可以通过分析Word的OpenXML(网上有标准)来获取需要的信息。程序效率中等,开发难度中等偏大。
参考技术A //这个我以前是保存在一个textBox 控件中
//可以看看
FileStream fs=new FileStream("fileName",FileMode.Open,FileAccess.Read);//打开一个文件流
StreamReader read=new StreamReader(fs,System.Text.Encoding.GetEncoding("gb2312"));按中文读出文件流,GB2312中文编码

txtContent.Text=read.ReadToEnd();//保存在txtContent.text
fs.close();//关闭一个文件流
参考技术B 如果你使用文件流读取Word文件内容,肯定是乱码的,你需要使用Office的接口读取才可以的,并且需要注意字符集的问题

word文档打开全是乱码怎么办

word乱码文档恢复方法如下:

工具/原料:台式机AH130、Windows10、Word2018

1、首先进入word,点击左上角的“文件”。

2、然后将文件以“rtf”格式进行保存。

3、保存成功之后再次将其打开。

4、并将该文件另存为。

5、最后选择“.docx”格式来进行保存并打开即可恢复。

参考技术A

word文档打开全是乱码的主要原因是内容的编码格式和word编码格式不一样,只要禁用显示域代码而非域值选项即可解决。具体如下:

电脑:华为笔记本。

系统:Windows10专业版2004。

工具:word2017。

1、在word文件的左上角点击文件选项卡。

2、在文件选项卡中左下角点击选项选项卡。

3、在选项选项卡中选择高级下拉菜单。

4、在高级菜单中找到显示域代码而非阈值选项,取消勾选即可。

word文档的作用

Word给用户提供了用于创建专业而优雅的文档工具,帮助用户节省时间,并得到优雅美观的结果。一直以来,Microsoft Office Word 都是最流行的文字处理程序。

作为 Office 套件的核心程序, Word 提供了许多易于使用的文档创建工具,同时也提供了丰富的功能集供创建复杂的文档使用。哪怕只使用 Word 应用一点文本格式化操作或图片处理,也可以使简单的文档变得比只使用纯文本更具吸引力。

以上是关于C# 怎么处理Word文件的乱码的主要内容,如果未能解决你的问题,请参考以下文章

word文件显示乱码怎么办?

Word文档乱码怎么办

word打开是乱码怎么办 word打开是乱码的解决方法

word文档打开全是乱码怎么办

为啥用abbyy图片转为word全是乱码

word有乱码怎么解决