Bit field

Posted 小马识图

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Bit field相关的知识,希望对你有一定的参考价值。

c 语言中的bit field 是一种节省内存的方式, 用于struct 或者 union 的成员变量的声明。基本的语法是:

struct BF 
   ...
  type_specifier [declarator] : constant_expression;
   ...
;

采用这样一种方式的好处是,我们可以明确地指定某一个成员变量在内存中占用的空间(constant_expression bits). 比如:

struct BitArray 
    unsigned a : 1;
    unsigned b : 1;
;

// sizeof(BitArray) == 4

struct BitArray2
    unsigned a;
    unsigned b;
;

// sizeof(BitArray2) == 8

上面的例子可以看出,使用了Bit field, 我们可以将相邻的变量ab 紧凑的排列到一个unsigned 中。 而如果不适用Bit field, 很明显编译器将会单独为ab 创建一个 unsigned 成员变量。

但是在使用bit field的时候,我们发现有很多限制或者注意点,这里罗列出大部分可能会碰到的问题。

  • 底层数据类型
    bit field 本身不是C/C++的基本类型,需要依附于底层数据在内存中的表示。一般多个bit fields 会共享一个底层数据类型所占用的内存空间。 底层类型只能是整形(char, short, int, long, long long 和 unsigned 变种) 或者枚举类型(enum ) :
enum E  E1, E2, E3, E4, E5, E6 = 200 ;

struct SMixture 
    char a : 1, b : 1 ; //ok
    E e1 : 2,  e2 : 2;  //ok
    float f : 3 ;       //compiler error
;
  • 如果底层类型大小不足以容纳所有的 bit fields, 则在内存中开辟新的底层数据类型以容纳更多的域,但是多余的域不会横跨相邻的底层数据空间,而是开辟新的空间开始放置多余的Bit fields.
struct SMixture 
    char a : 1;  //start of first char
    char b : 3;  //continue in the first char
    char c : 5;  //start of second char
    char d : 4;  //start of third char
;

// sizeof(SMixture) == 3;
  • 匿名域(unnamed bit field)起padding的作用。 如果域的大小为0,则必须匿名(unnamed ).
struct SMixture 
   char c : 1;
   char d : 0; //compiler error
   char : 0;   //okay
;

width 为0的域是特殊域,表示该0-width bit field的下一个成员的地址必须以该0-width bit field 的类型的对齐方式对齐。

struct SMixture 
   char c : 1;   //start of char
   int : 0;
   short d : 1;   //start of short after alignment at type int boundary
;
//sizeof(SMixture) == 6;

struct SMixture2 
   char c : 1;   //start of char
   int : 0;
   short d;   //start of short after alignment at type int boundary
;
//sizeof(SMixture2) == 6
  • 不能通过地址操作符(&)获取bit field的地址,因此bit field不能通过指针访问, 也不能通过引用访问。
int main()
    SMixture s;
    short* ps = &s.d; //compiler error
    short& rs = s.d;  //compiler error
    return 0;
  • Bit field 不能是 static 成员。
struct SMixture 
   static char c : 1;   //compiler error
;
  • 使用bit field 的初衷是为了节省内存的消耗,但是最终的结果可能事与愿违。虽然bit field一定会减少类型的数据空间, 但是为了进行比特位操作,编译器不得不在生成的代码中加入额外的控制代码。因此最终的代码有可能比不使用bit field的情形还要大。另外一方面,直接访问整型数据类型一定会比访问bit fields要快。因此,在代码中使用bit field的情形可能相当有限。比如, 在这篇stackoverflow的文章中提到跨平台或者硬件的二进制文件的兼容问题,此时可能需要将某些成员变量强制对齐到某个位置:
/* from xnu/bsd/netinet/bootp.h */
/*
 * Bootstrap Protocol (BOOTP).  RFC 951.
 */
/*
 * HISTORY
 *
 * 14 May 1992 ? at NeXT
 *  Added correct padding to struct nextvend.  This is
 *  needed for the i386 due to alignment differences wrt
 *  the m68k.  Also adjusted the size of the array fields
 *  because the NeXT vendor area was overflowing the bootp
 *  packet.
 */
/* . . . */
struct nextvend 
  u_char nv_magic[4]; /* Magic number for vendor specificity */
  u_char nv_version;  /* NeXT protocol version */
  /*
   * Round the beginning
   * of the union to a 16
   * bit boundary due to
   * struct/union alignment
   * on the m68k.
   */
  unsigned short  :0;
  union 
    u_char NV0[58];
    struct 
      u_char NV1_opcode;  /* opcode - Version 1 */
      u_char NV1_xid; /* transcation id */
      u_char NV1_text[NVMAXTEXT]; /* text */
      u_char NV1_null;  /* null terminator */
     NV1;
   nv_U;
;

以上是关于Bit field的主要内容,如果未能解决你的问题,请参考以下文章

位域 (Bit field)

MySQL的btree索引和hash索引的区别

结构体Bit-field

结构体里的“位域”(bit-field)结构

C 语言编程 — 构造数据类型 — 位域(bit field)

C 语言编程 — 构造数据类型 — 位域(bit field)