使用c#的StreamReader类读取中文乱码

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用c#的StreamReader类读取中文乱码相关的知识,希望对你有一定的参考价值。

FileStream fs = new FileStream(_filePath, FileMode.Open, FileAccess.Read);

StreamReader read = new StreamReader(fs,Encoding.Default);

string str;

while (read.Peek() != -1)



str = read.ReadLine();

Console.WriteLine(str);


已经使用了Encoding.Default这个参数 但是中文还是乱码,源文件是用excel转成的文本文件(制表符分割)这个形式的了,是Ansi格式的,求大神指点
乱码样式如图

参考技术A 文件编码方式与你读取时的不一致吧,StreamReader read = new StreamReader(fs,Encoding.Default); 把Encoding.Default,改成Encoding.UTF8试下。追问

谢谢回答,应该是引擎的问题导致读取有问题的

本回答被提问者采纳
参考技术B StreamReader read = new StreamReader(fs,Encoding.Default);
改成
StreamReader read = new StreamReader(fs,Encoding.GetEncoding("gb2312"));追问

谢谢回答,应该是引擎的问题导致读取有问题的

C#中StreamReader读取中文时出现乱码问题总结

之前有一篇文章“ C#读取及写入配置文件教程”http://blog.csdn.net/lisenyang/article/details/47291083)当中有一个问题就是在读取配置文件时候中文出现乱码情况。这是为什么呢?原因是自Windows 2000之后的操作系统在文件处理时默认编码採用Unicode。所以.NET文件的默认编码也是Unicode。除非另外指定,StreamReader的默认编码为Unicode,而不是当前系统的ANSI代码页。可是文档大部分还是以ANSI编码存储,中文文本使用的是GB2312,所以才造成中文乱码。
首先。先和大家一起了解一个东西---“系统的当前 ANSI 代码页编码”,假设你要处理ANSI且codepage为GB2312的文件。或者其它已知编码类型的I/O接口。那么最好直接写Encoding.GetEncoding("GB2312"),由于Encoding.Default可能会变,而假设是一个全新的系统,则最好使用“Encoding.UTF8”,由于UTF8能够兼容世界上绝大多数语种。且效率较好,.NET默认也是用UTF8编码类型!

我们看下查看和改动当前系统的ANSI代码页编码:

Linux系统查看locale的方法:在终端输入locale
windows查看代码页方法:在cmd.exe输入chcp,或者右键cmd.exe属性查看。

改动locale:
Linux系统改动配置文件/etc/sysconfig/i18n或/etc/sysconfig/language
Windows在開始-控制面板-区域和语言选项-选择一个语言

改动session local的方法:
windows在CMD命令行输入 mode con cp select=437
linux在终端export LANG=zh_CN.UTF8

如图:

技术分享


之前我的代码例如以下:

技术分享



改动后代码例如以下:

技术分享













以上是关于使用c#的StreamReader类读取中文乱码的主要内容,如果未能解决你的问题,请参考以下文章

C# 文件流 streamreader如何读取文本指定行的数据?

c#streamreader 有的机器乱码有的不乱吗

C# StreamReader类和StreamWriter类

(12)C#传智:File类,泛型,字典,FileStream,StreamReader,多态

C#中FileStream和StreamWriter/StreamReader的区别

C#处理文本文件TXT实例详解