wchar_t到unsigned char转换
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了wchar_t到unsigned char转换相关的知识,希望对你有一定的参考价值。
我有一个代码实现以下内容:
unsigned char charStr; //this var can only take a value either 0, 1, or 2
WCHAR wcharStr;
...
charStr = wcharStr - '0';
...
我知道在从Unicode(wchar_t数据类型)转换为ANSI(unsigned char)时可能会丢失一些数据(从16位到8位)。但是,有人可以解释为什么减去'0'使这种转换正确吗?
C和C ++语言标准要求从0
到9
的数字编码是连续的。因此,减去'4' - '0'
,例如,将获得4
。
wchar_t
实际上并不需要这样,但在现实世界中,您的编译器会将其映射到Unicode,Windows上为UTF-16,其他地方为UCS-4。 Unicode的前128个代码点与ASCII相同。您没有在使用非ASCII字符集的现代真实编译器上编译此代码(IBM的Z系列大型机,为了向后兼容而默认为代码页1047),因此您的编译器会转换您的wchar_t
和char
一些整数类型,可能是32位宽,减去并获得一个数字值。然后它将它存储在unsigned char
类型的变量中,这是一个错误,因为它实际上是一个不可打印的控制字符的ASCII值。
此代码不正确。如果你想从wchar_t
转换为char
,你应该使用STL的codecvt
或C标准库中的wcrtomb()
。当且仅当可能时,还有一个wctob()
转换为单个字节。在使用之前设置您的语言环境。
如果你确定你的wchar_t
拥有Unicode,你的unsigned char
持有Latin-1,并且你的值在范围内,但是,你可以简单地将wchar_t
值转换为(unsigned char)
。另一种方法,如果你知道你有一个数字,就是写(charStr - L'0') + '0'
。
以上是关于wchar_t到unsigned char转换的主要内容,如果未能解决你的问题,请参考以下文章