c++处理中文字符

Posted 2016bits

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了c++处理中文字符相关的知识,希望对你有一定的参考价值。

目前在使用c++处理docx文档,在处理中文字符时遇到了中文乱码的问题,所以参考https://www.cnblogs.com/ranjiewen/p/5770639.html解决了这个问题

主要是因为英文字符是单字节存储char,而中文字符是双字节存储wchar,所以需要将char转化为wchar

wchar_t* convert(const char str[])

	size_t size = strlen(str);
	wchar_t *buffer = new wchar_t[size];
	DWORD dsize = MultiByteToWideChar(CP_UTF8, 0, str, size, NULL, 0);
	MultiByteToWideChar(CP_UTF8, 0, str, size, buffer, dsize);
	buffer[dsize] = L'\\0';
	return buffer;

特别注意:需要在字符结尾添加结束符L'\\0',否则就会出现乱码。

以上是关于c++处理中文字符的主要内容,如果未能解决你的问题,请参考以下文章

C++字符串结尾是不是有'\0'也就是string类的结尾是啥?

C++学习(三六四)notepad如何查看行结尾的字符

字符串中的 C++ 回车和换行

❥关于C++之文件结尾及处理

C++ std::string::npos常量(值为-1)(表示“直到字符串的结尾”,作为返回值,它通常用于表示不匹配)

预指令