CStdioFile UNICODE编译 英文系统下读取中文汉字乱码解决

Posted 我来乔23

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了CStdioFile UNICODE编译 英文系统下读取中文汉字乱码解决相关的知识,希望对你有一定的参考价值。

  转载出处:http://www.cnblogs.com/ct0421/p/3242418.html

  函数原形为:char *setlocale( int category, const char *locale );
  头文件:<locale.h>
  所支持的操作系统为:ANSI, Win 95, Win NT
  对于简体中文可以使用如下设置:setlocale( LC_ALL, "chs" ); 
  为什么一定要调用setlocale呢?
  因为在C/C++语言标准中定义了其运行时的字符集环境为"C",也就是ASCII字符集的一个子集,那么mbstowcs在工作时会将cstr中所包含的字符串看作是ASCII编码的字符,而不认为是一个包含有chs编码的字符串,所以他会将每一个中文拆成2个ASCII编码进行转换,这样得到的结果就是会形成4个wchar_t的字符组成的串,那么如何才能够让mbstowcs正常工作呢?在调用mbstowcs进行转换之间必须明确的告诉mbstowcs目前cstr串中包含的是chs编码的字符串,通过setlocale( LC_ALL, "chs" )函数调用来完成,需要注意的是这个函数会改变整个应用程序的字符集编码方式,必须要通过重新调用setlocale( LC_ALL, "C" )函数来还原,这样就可以保证mbstowcs在转换时将cstr中的串看作是中文串,并且转换成为2个wchar_t字符,而不是4个。

  本地化设置需要具备三个条件:
  a. 语言代码 (Language Code)
  b. 国家代码 (Country Code) 
  c. 编码(Encoding)
  本地名字可以用下面这些部分来构造:
  语言代码_国家代码.编码 比如(zh_CN.UTF-8, en_US等)

 C++ Code 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
 
CStdioFile file;
//设置语言为中文,否则在Unicode编码下读出中文字符为乱码 
char* old_locale = _strdup( setlocale(LC_CTYPE, NULL) ); 
setlocale( LC_CTYPE,
"chs");
//打开文件 
file.Open( strFilePath, CStdioFile::modeRead); 
//读取内容
CString str;
file.ReadString(str);
//关闭文件 
file.Close();
//还原语言区域的设置,还原区域设定
setlocale( LC_CTYPE, old_locale ); 
free( old_locale );

  注意:读取txt文件时,请修改txt文件编码为ANSI

以上是关于CStdioFile UNICODE编译 英文系统下读取中文汉字乱码解决的主要内容,如果未能解决你的问题,请参考以下文章

VC++中CStdioFile的Unicode问题

MFC - CStdioFile 读取txt文件UNICODE 中文异常

CFile CStdioFile CArchive 文件操作之异同(详细)

c++ CStdioFile::WriteString 给出不正确的文件输出

如何使用 CStdioFile 读取文本文件的最后 10 行

使用 CFile 的子类 CStdioFile 的注意事项 2