c++处理中文字符

Posted 2016bits

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了c++处理中文字符相关的知识,希望对你有一定的参考价值。

目前在使用c++处理docx文档,在处理中文字符时遇到了中文乱码的问题,所以参考https://www.cnblogs.com/ranjiewen/p/5770639.html解决了这个问题

主要是因为英文字符是单字节存储char,而中文字符是双字节存储wchar,所以需要将char转化为wchar

wchar_t* convert(const char str[])
{
	size_t size = strlen(str);
	wchar_t *buffer = new wchar_t[size];
	DWORD dsize = MultiByteToWideChar(CP_UTF8, 0, str, size, NULL, 0);
	MultiByteToWideChar(CP_UTF8, 0, str, size, buffer, dsize);
	buffer[dsize] = L'\\0';
	return buffer;
}

特别注意:需要在字符结尾添加结束符L'\\0',否则就会出现乱码。

以上是关于c++处理中文字符的主要内容,如果未能解决你的问题,请参考以下文章

以下代码片段 C++ 的说明

有趣的 C++ 代码片段,有啥解释吗? [复制]

此 Canon SDK C++ 代码片段的等效 C# 代码是啥?

什么是在 C++ 中获取总内核数量的跨平台代码片段? [复制]

使用 C++ 反转句子中的每个单词需要对我的代码片段进行代码优化

CSP核心代码片段记录