UTF-8编码的xml文件带头部信息,用XmlDocument解析出错问题

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了UTF-8编码的xml文件带头部信息,用XmlDocument解析出错问题相关的知识,希望对你有一定的参考价值。


1.使用UE查看文件,切换到16进制编辑。

 前面三位 EF BB BF 是UTF-8编码的表示。

 

前面两位是:FF FE 表示是Unicode编码

3C是小于符号(<)的ASCII码16进制数值,它前面是编码头BOM的标识。

在读取文件的时候,根据前面的BOM标识,截取前面字符,再使用XmlDocument进行解析,即可正常。

以上是关于UTF-8编码的xml文件带头部信息,用XmlDocument解析出错问题的主要内容,如果未能解决你的问题,请参考以下文章

C# XML 字符串编码问题

xml已经指定了UTF-8编码格式仍然导出中文乱码

使用UTF-8生成XML文件时的字符编码问题

dom4j解析xml文件,xml的编码是utf-8,里边的中文解析出来是乱码,怎么解决? 文件用ie打开是正常的。

java怎样保存xml文件为UTF-8 + bom

delphi 保存UTF-8格式的xml文件,在IE中有乱码。