c++处理中文字符

Posted 2016bits

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了c++处理中文字符相关的知识,希望对你有一定的参考价值。

目前在使用c++处理docx文档,在处理中文字符时遇到了中文乱码的问题,所以参考https://www.cnblogs.com/ranjiewen/p/5770639.html解决了这个问题

主要是因为英文字符是单字节存储char,而中文字符是双字节存储wchar,所以需要将char转化为wchar

wchar_t* convert(const char str[])

	size_t size = strlen(str);
	wchar_t *buffer = new wchar_t[size];
	DWORD dsize = MultiByteToWideChar(CP_UTF8, 0, str, size, NULL, 0);
	MultiByteToWideChar(CP_UTF8, 0, str, size, buffer, dsize);
	buffer[dsize] = L'\\0';
	return buffer;

特别注意:需要在字符结尾添加结束符L'\\0',否则就会出现乱码。

以上是关于c++处理中文字符的主要内容,如果未能解决你的问题,请参考以下文章