c++处理中文字符
Posted 2016bits
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了c++处理中文字符相关的知识,希望对你有一定的参考价值。
目前在使用c++处理docx文档,在处理中文字符时遇到了中文乱码的问题,所以参考https://www.cnblogs.com/ranjiewen/p/5770639.html解决了这个问题
主要是因为英文字符是单字节存储char,而中文字符是双字节存储wchar,所以需要将char转化为wchar
wchar_t* convert(const char str[])
size_t size = strlen(str);
wchar_t *buffer = new wchar_t[size];
DWORD dsize = MultiByteToWideChar(CP_UTF8, 0, str, size, NULL, 0);
MultiByteToWideChar(CP_UTF8, 0, str, size, buffer, dsize);
buffer[dsize] = L'\\0';
return buffer;
特别注意:需要在字符结尾添加结束符L'\\0',否则就会出现乱码。
以上是关于c++处理中文字符的主要内容,如果未能解决你的问题,请参考以下文章
C++字符串结尾是不是有'\0'也就是string类的结尾是啥?
C++ std::string::npos常量(值为-1)(表示“直到字符串的结尾”,作为返回值,它通常用于表示不匹配)