如何获取一个unsigned char*类型的字符串长度

Posted 2023-03-21

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了如何获取一个unsigned char*类型的字符串长度相关的知识，希望对你有一定的参考价值。

　　有两种方式：

　　1 使用数据类型强制转换，示例带如下：

unsigned char s[100] = "abcdef";
int len = strlen((char*)s);

　　2 另外一种方式就是自己实现该方法，进行统计。

　　对于C/C++中的字符串，必须是以'\\0'结尾的，因此可以如下做

int getLen(const unsigned char s[])

    int nLen = 0;
    const unsigned char* p = s;
    while(*p!=0)
        nLen++;
        p++;

    return nLen;

参考技术A char*转换

Qt下面，字符串都用QString，确实给开发者提供了方便，想想VC里面定义的各种变量类型，而且函数参数类型五花八门，经常需要今年新那个类型转换
Qt再使用第三方开源库时，由于库的类型基本上都是标准的类型，字符串遇的多的就是Char*类型
在Qt下怎样将QString转char*呢，需要用到QByteArray类，QByteArray类的说明详见Qt帮助文档。
因为char*最后都有一个‘/0’作为结束符，而采用QString::toLatin1()时会在字符串后面加上‘/0’
方法如下：
Qstring str;
char* ch;
QByteArray ba = str.toLatin1();
ch=ba.data();
这样就完成了QString向char*的转化。经测试程序运行时不会出现bug
注意第三行，一定要加上，不可以str.toLatin1().data()这样一部完成，可能会出错。

补充：以上方法当QString里不含中文时，没有问题，但是QString内含有中文时，转换为char*就是乱码，采用如下方法解决：
方法1：
添加GBK编码支持：
#include <QTextCodec>
QTextCodec::setCodecForTr(QTextCodec::codecForName("GBK"));
QTextCodec::setCodecForLocale(QTextCodec::codecForName("GBK"));
然后改变上面的第三行为：QByteArray ba = str.toLoacl8Bit(); toLoacl8Bit支持中文
方法2：
先将QString转为标准库中的string类型，然后将string转为char*，如下：
std::string str = filename.toStdString();
const char* ch = str.c_str();本回答被提问者和网友采纳参考技术B 有两种方式：
1 使用数据类型强制转换，示例带如下：

1
2

unsigned char s[100] = "abcdef";
int len = strlen((char*)s);

2 另外一种方式就是自己实现该方法，进行统计。
对于C/C++中的字符串，必须是以'\0'结尾的，因此可以如下做

1
2
3
4
5
6
7
8
9
10

int getLen(const unsigned char s[])

int nLen = 0;
const unsigned char* p = s;
while(*p!=0)
nLen++;
p++;

return nLen;

char和unsigned char--数据类型区别

char和unsigned char --数据类型区别

除去布尔型和扩展的字符型之外，其它整型可以划分为带符号的（signed）和无符号的（unsigned）两种。

类型int、short、long和long long都是带符号的，通过在这些类型名前添加unsigned就可以得到无符号类型。

与其它整型不同，字符型被分为了三种：char、singed char和unsigned char。需特别注意的是：类型char和类型signed char并不一样。尽管字符型有三种，但字符的表现形式却只有两种：带符号的和无符号的。类型char实际上会表现为上述两种形式中的一种，具体是哪种是由编译器决定。

首先在内存中，char与unsigned char没有什么不同，都是一个字节，唯一的区别是，char的最高位为符号位，因此char能表示-128~127, unsigned char没有符号位，因此能表示0~255，这个好理解，8个bit，最多256种情况，因此无论如何都能表示256个数字。所以在普通的赋值、读写文件和网络字节流中都没什么区别，反正就是一个字节，不管最高位是什么，最终的读取结果都一样，只是你怎么理解最高位而已，在屏幕上面的显示可能不一样。

但是我们却发现在表示byte时，都用unsigned char，这是为什么呢？首先我们通常意义上理解，byte没有什么符号位之说，更重要的是如果将byte的值赋给int，long等数据类型时，系统会做一些额外的工作。如果是char，那么系统认为最高位是符号位，而int可能是16或者32位，那么会对最高位进行扩展（注意，赋给unsigned int也会扩展）而如果是unsigned char，那么不会扩展。

测试代码：

#include <stdio.h>
void f(unsigned char v)
{  
    char c = v;  
    unsigned char uc = v;  
    unsigned int a = c, b = uc;  
    int i = c, j = uc;  
    printf("----------------
");  
    printf("%%c: %c, %c
", c, uc);  
    printf("%%X: %X, %X
", c, uc);  
    printf("%%u: %u, %u
", a, b);  
    printf("%%d: %d, %d
", i, j);  
}  
int main(int argc, char *argv[])  
{  
    f(0x80);  
    f(0x7F);   
    return 0;  
}

输出：

%c: ?, ?
%X: FFFFFF80, 80
%u: 4294967168, 128
%d: -128, 128
----------------
%c: , 
%X: 7F, 7F
%u: 127, 127
%d: 127, 127

以上是关于如何获取一个unsigned char*类型的字符串长度的主要内容，如果未能解决你的问题，请参考以下文章

如何将C++中string类型的字符串赋给unsigned char数组

在C语言中，unsigned char是啥类型

如何在python中将unsigned char类型的int字符串转换为int

如何将C++中string类型的字符串赋给unsigned char数组

c语言byte类型 typedef unsigned char byte[20]; 如何初始化

怎么把unsigned char数组转化为字符串类型