C#怎么判断一个文件的编码格式是UTF-8 without BOM的啊

Posted 2023-03-18

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了C#怎么判断一个文件的编码格式是UTF-8 without BOM的啊相关的知识，希望对你有一定的参考价值。

文本文件的开头头三个字节存放编码格式，这三个字节就叫做 BOM。

当头部开始的两个字节为 0xff 0xfe 0x41 时，是Unicode的小尾编码；当头部的两个字节为 0xfe 0xff 0x00 时，是Unicode的大尾编码；当头部两个字节为 0xef 0xbb 0xbf 时，是Unicode的UTF-8编码；当它不为这些时，则是ANSI编码。

判断是ANSI还是无BOM的UTF-8还得多一步，这里有一篇很好的代码示例，我就不做搬运工了：http://blog.csdn.net/dqswuyundong/article/details/40376751 参考技术A C#写文件时指定是否有BOM：
1）下面的代码是UTF-8 without BOM:

var utf8WithoutBom = new System.Text.UTF8Encoding(false);
using (var sink = new StreamWriter("Foobar.txt", false, utf8WithoutBom))

sink.WriteLine("...");

2）下面是C#在写文件时指定BOM头的代码：
var utf8WithBom = new System.Text.UTF8Encoding(true); // 用true来指定包含bom

StreamWriter swr = null;
try

swr = new StreamWriter("okbase.txt", false, utf8WithBom);
swr.Write("hello okbase.net!");

catch(Exception e)

finally

if (swr != null)

swr.Close();
swr.Dispose();

以上是关于C#怎么判断一个文件的编码格式是UTF-8 without BOM的啊的主要内容，如果未能解决你的问题，请参考以下文章

java 怎么获得文件编码格式

java怎么查看一段中文是啥编码格式

怎么辨别文本文档的编码？

如何判断一个文件的编码格式，UNICODE,BIG5,毕业设计

C# XML 字符串编码问题

没有文件头的txt文件，如何判断是啥编码格式