Sword 计算机内存对齐

Posted 2021-03-25 zhanggaofeng

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Sword 计算机内存对齐相关的知识，希望对你有一定的参考价值。

内存对齐理论

a.数据的对齐(alignment)
指数据的地址和由硬件条件决定的内存块大小之间的关系。一个变量的地址是它大小的倍数的时候，这就叫做自然对齐(naturally aligned)。
例如，对于一个32bit的变量，如果它的地址是4的倍数(地址的低两位是0--备注1)，那么这就是自然对齐.
对齐的规则是由硬件引起的。一些体系的计算机在数据对齐这方面有着很严格的要求。在一些系统上，一个不对齐的数据的载入可能会引起进程的陷入。
在另外一些系统，对不对齐的数据的访问是安全的，但却会引起性能的下降。在编写可移植的代码的时候，对齐的问题是必须避免的，所有的类型都该自然对齐。

b.预对齐内存的分配
在大多数情况下，编译器和C库透明地帮你处理对齐问题。POSIX标明了通过malloc(),calloc(),和realloc()返回的地址对于任何的C类型来说都是对齐的。
在Linux中，这些函数返回的地址在32位系统是以8字节为边界对齐，在64位系统是以16字节为边界对齐的。有时候，对于更大的边界，程序员需要动态的对齐。
虽然动机是多种多样的，但最常见的是直接块I/O的缓存的对齐或者其它的软件对硬件的交互，因此，POSIX 1003.1d提供一个叫做posix_memalign( )的函数

c.数据对齐的性能提升
对于现代计算机硬件来说，内存只能通过特定的对齐地址（比如按照机器字）进行访问。举个例子来说，
比如在64位的机器上，不管我们是要读取第0个字节还是要读取第1个字节，在硬件上传输的信号都是一样的。
因为它都会把地址0到地址7，这8个字节全部读到CPU，只是当我们是需要读取第0个字节时，丢掉后面7个字节，
当我们是需要读取第1个字节，丢掉第1个和后面6个字节。
假设我们要读取2个字节，这两个字节刚好落在两个机器字内时，就出现两次访问内存的情况，同时通过一些逻辑计算才能得到最终的结果。
因此，为了更好的提升性能，我们须尽量将结构体做到机器字（或倍数）对齐，而结构体中一些频繁访问的字段也尽量安排在机器字对齐的位置。

备注1:
二进制现象解释
对于二进制数 *****000 无论高5位怎么变化，该数一定8的倍数(对于二进制数 ******00 无论高6位怎么变化，该数一定4的倍数)
因为是二进制， *****000 除以 2 ，结果和 0*****00 一致，相当于二进制数的每一位都降1阶，
那么 *****000 一共可以除以3个2，即可以除以8，因此 *****000 一定是8的倍数

/* 内存对齐 */

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <string>

#ifndef NGX_ALIGNMENT
#define NGX_ALIGNMENT   sizeof(unsigned long)    /* platform word */
#endif

/*
设计说明
    sizeof(unsigned long)
    在32位操作平台上，unsigned long 的大小是4个字节，恰巧32位平台的机器字也是4个字节
    在64位操作平台上，unsigned long 的大小是8个字节，恰巧64位平台的机器字也是8个字节
*/

#define ngx_align_ptr(p, a)                                                   
    (unsigned char *) (((unsigned int) (p) + ((unsigned int) a - 1)) & ~((unsigned int) a - 1))

/*
设计说明:
    ngx_align_ptr宏定义设计详解
    (unsigned int) (p) 把地址当做整数进行操作，为了计算 整数p 加多少才是 a 的倍数

    (unsigned int) (p) + ((unsigned int) a - 1 将 整数p 向上扩充，因为是内存对齐，地址只能向后跑。向前跑就可能内存越界
    假设a是8，(((unsigned int) (p) + ((unsigned int) a - 1)) & ~((unsigned int) a - 1)) 只会影响 低3位，如果 整数p 在低位上有值，
    那么 整数p 就会比原来小，而 整数p + a - 1 整数p的低3位上全部加1，如果 整数p 低3位上有值，肯定会产生进位，
    这样可以确保操作后的 整数p 绝对比 原来的整数p 大

    (((unsigned int) (p) + ((unsigned int) a - 1)) & ~((unsigned int) a - 1)) 假设a是8，该操作就会将 整数p 后3位变成0
*/

int main()
{
    //示例用法
    void * p = (void *)0x2379b1;
    //进行内存对齐操作
    p = ngx_align_ptr(p, NGX_ALIGNMENT);
    return 0;
}

posix_memalign

函数原型
int posix_memalign(void **memptr, size_t alignment, size_t size);

函数说明
调用posix_memalign( )成功时会返回size字节的动态内存，并且这块内存的地址是alignment的倍数。参数alignment必须是2的幂，
还是void指针的大小的倍数。返回的内存块的地址放在了memptr里面，函数返回值是0.

返回值
调用失败时，没有内存会被分配，memptr的值没有被定义，返回如下错误码之一：
EINVAL
参数不是2的幂，或者不是void指针的倍数。
ENOMEM
没有足够的内存去满足函数的请求。

注意
posix_memalign函数，errno不会被设置，只能通过返回值得到。
由posix_memalign( )获得的内存通过free( )释放

以上是关于Sword 计算机内存对齐的主要内容，如果未能解决你的问题，请参考以下文章