.Net Core 读取文件时中文乱码问题的解决方法

Posted 2022-02-22 dotNET跨平台

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了.Net Core 读取文件时中文乱码问题的解决方法相关的知识，希望对你有一定的参考价值。

背景

今天在使用core web api上传txt文档的时候本来很顺利的，但是一测试发现读取的中文内容是乱码的，很是纳闷。

出于经验，立马把代码的Encoding.Default改成 Encoding.uft8, 发现还是不行。后面索性把上传的文件另存为下，特地选择带有bom的utf8选项。

但是发现还是乱码。郁闷。

问题

于是在本能的百度下，发现方法一大堆，但是没有一个可以解决问题的。

无意中，发现了链接，找到了官网如下

https://docs.microsoft.com/zh-cn/dotnet/api/system.text.encoding.default?view=netcore-3.1#System_Text_Encoding_Default

进去之后，豁然开朗。里面是这么写的，关于Encoding.Default 属性的定义是这样的。

.NET Framework 中的默认属性

在 Windows 桌面上的 .NET Framework 中， Default 属性始终获取系统的活动代码页并创建 Encoding 与其对应的对象。活动代码页可能是 ANSI 代码页，其中包括 ASCII 字符集以及不同于代码页的其他字符。由于所有 Default 基于 ANSI 代码页的编码都将丢失数据，因此请考虑 Encoding.UTF8 改用编码。在 U + 00 到 U + 7F 范围内，UTF-8 通常是相同的，但可以在不丢失的情况下在 ASCII 范围外对字符进行编码。

.NET Core 上的默认属性

在 .NET Core 中， Default 属性始终返回 UTF8Encoding 。在运行 .NET Core 应用程序的所有操作系统（Windows、Linux 和 macOS）上都支持 UTF-8。

解决办法

So,.NET Framework 中默认编码是GB2312，而在 .NET Core 中不支持，若想使用必须得先注册编码

代码如下

var completeFilePath = Path.Combine(filePath, saveName);
                    var stream = formFile.OpenReadStream();
                    Encoding.RegisterProvider(CodePagesEncodingProvider.Instance);
                    Encoding encoding = Encoding.GetEncoding("gb2312");
                    using var reader = new StreamReader(stream, encoding);
                    var input = reader.ReadToEnd();

到此，问题解决。

以上是关于.Net Core 读取文件时中文乱码问题的解决方法的主要内容，如果未能解决你的问题，请参考以下文章

Java笔记-解决读取文件时中文乱码问题（InputStreamReader设置编码）

[ASP.NET][C#]下载文件时中文文件名出现乱码

python读写csv时中文乱码问题解决办法

Git - 执行git show等命令时中文显示乱码

net导出excel,在firefox下下载时中文文件名为乱码。

git解决git status 时中文乱码问题