数据的存储--->大小端字节序(Big Endian)&(Little Endian)

Posted 威化小餅干

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据的存储--->大小端字节序(Big Endian)&(Little Endian)相关的知识,希望对你有一定的参考价值。

⛩️ 博主主页@威化小餅干
📝 系列专栏【C语言】藏宝图
🎏 ✨ 绳锯⽊断,⽔滴⽯穿!一个编程爱好者的学习记录!

前言

计算机硬件有两种存储数据的方式:

  • 大端字节序——Big Endian

  • 小端字节序——Little EEndian

字节序,就是计算机存储多字节数据的方式。

一、大小端字节序名字来源

关于“ little endian(小端)”和“ big endian(大端)”的由来,网传有一个有趣的故事,可以追溯到1726年的Jonathan Swift的《格列佛游记》,其中一篇讲到有两个国家因为吃鸡蛋究竟是先打破较大的一端还是先打破较小的一端而争执不休,甚至爆发了战争。
《格利佛游记》:“Lilliput和Blefuscu这两个强国在过去的36个月中一直在苦战。战争的原因是:我们都知道,吃鸡蛋的时候,原始的方法是打破鸡蛋较大的一端,可是那时的皇帝的祖父由于小时侯吃鸡蛋,按这种方法把手指弄破了,因此他的父亲,就下令,命令所有的子民吃鸡蛋的时候,必须先打破鸡蛋较小的一端,违令者重罚。然后老百姓对此法令极为反感,由此发生了多次叛乱,产生叛乱的原因就是另一个国家Blefuscu的国王大臣煽动起来的。叛乱平息后,流亡的人就逃到这个帝国避难。据估计,先后几次有11000余人情愿死也不肯去打破鸡蛋较小的端吃鸡蛋。”

二、什么是大小端

  • 大端(存储)模式:是指数据的低位保存在内存的高位地址中,而数据的高位保存在内存的低地址中

  • 小端(储存)模式:是指数据的低位保存在内存的低位地址中,而数据的高位保存在内存的高地址中

🤔不懂?请看下图解析

int i = 1;

在64位的平台中,找到i 的地址为:0x00000E810BDF454,内存中存放着01 00 00 00。有没有发现它是倒着存的,这其实就是小端存储。

【1】、小端

判断大小端是以字节来看的,如16进制数0x11223344,则11相对于其它是高位,就好比十进制123,1是百位,2是十位,3是个位,则1相对于2、3,为高位请看下面的图解。

大小端是由底层硬件决定的,那怎样看是不是小端?

  • 一句话——>“低 低 ->为小”

数据的低位放在内存的低位,则为小端。一般我们去内存中查看数据时,小端一般是倒着存放的,如下图


【2】、大端

大端:将数据的低位保存在内存的高位地址中,而数据的高位保存在内存的低地址中。


三、大厂笔试题

设计一个小程序来判断当前机器的 字节序

解法思路:

  • 判断该机器为大小端存储模式,既需要判断存进去一个数据存储的顺序为数据本身顺序还是逆顺序

  • 如创建一个变量i:int i = 1,看它存进去的是00 00 00 01还是01 00 00 00,再进一步想,只需要判断最低位为00还是01,就可以判断大小端了。我们可以利用强制类型转换,让char*来得到这个第一位的数值,再判断是01后输出即可。

解题代码:

#include<stdio.h>

int check()

    int i = 1;
    char* p = (char*)&i;
    if (*p == 1)
        return 1;
    else
        return 0;

int main()

    int ret = check();
    if (ret == 1)
    
        printf("小端\\n");
    
    else
    
        printf("大端\\n");
    
    return 0;

完结

✨✨请各位小伙伴多多点赞关注收藏支持鸭!✨✨

大端存储和小端存储

一、什么是字节序
字节序,顾名思义字节的顺序,再多说两句就是大于一个字节类型的数据在内存中的存放顺序(一个字节的数据当然就无需谈顺序的问题了)。其实大部分人在实际的开 发中都很少会直接和字节序打交道。唯有在跨平台以及网络程序中字节序才是一个应该被考虑的问题。

在所有的介绍字节序的文章中都会提到字 节序分为两类:Big-Endian和Little-Endian,引用标准的Big-Endian和Little-Endian的定义如下:
a) Little-Endian就是低位字节排放在内存的低地址端,高位字节排放在内存的高地址端。
b) Big-Endian就是高位字节排放在内存的低地址端,低位字节排放在内存的高地址端。
c) 网络字节序:TCP/IP各层协议将字节序定义为Big-Endian,因此TCP/IP协议中使用的字节序通常称之为网络字节序。

1.1 什么是高/低地址端
首先我们要知道C程序映像中内存的空间布局情况:在《C专 家编程》中或者《Unix环境高级编程》中有关于内存空间布局情况的说明,大致如下图:
----------------------- 最高内存地址 0xffffffff
栈底

栈顶
-----------------------

NULL (空洞)
-----------------------

-----------------------
未初始 化的数据
----------------------- 统称数据段
初始化的数据
-----------------------
正 文段(代码段)
----------------------- 最低内存地址 0x00000000
由图可以看出,再内存分布中,栈是向下增长的,而堆是向上增长的。
以上图为例如果我们在栈 上分配一个unsigned char buf[4],那么这个数组变量在栈上是如何布局的呢?看下图:
栈底 (高地址)
----------
buf[3]
buf[2]
buf[1]
buf[0]

----------
栈顶 (低地址)
其实,我们可以自己在编译器里面创建一个数组,然后分别输出数组种每个元素的地址,来验证一下。
1.2 什么是高/低字节
现在我们弄清了高/低地址,接着考虑高/低字节。有些文章中称低位字节为最低有效位,高位字节为最高有效位。如果我们有一个32位无符号整型0x12345678,那么高位是什么,低位又是什么呢? 其实很简单。在十进制中我们都说靠左边的是高位,靠右边的是低位,在其他进制也是如此。就拿 0x12345678来说,从高位到低位的字节依次是0x12、0x34、0x56和0x78。
高/低地址端和高/低字节都弄清了。我们再来回顾 一下Big-Endian和Little-Endian的定义,并用图示说明两种字节序:
以unsigned int value = 0x12345678为例,分别看看在两种字节序下其存储情况,我们可以用unsigned char buf[4]来表示value:
Big-Endian: 低地址存放高位,如下图:
栈底 (高地址)
---------------
buf[3] (0x78) -- 低位
buf[2] (0x56)
buf[1] (0x34)
buf[0] (0x12) -- 高位
---------------
栈顶 (低地址)

Little-Endian: 低地址存放低位,如下图:
栈底 (高地址)
---------------
buf[3] (0x12) -- 高位
buf[2] (0x34)
buf[1] (0x56)
buf[0] (0x78) -- 低位
--------------
栈 顶 (低地址)

以上是关于数据的存储--->大小端字节序(Big Endian)&(Little Endian)的主要内容,如果未能解决你的问题,请参考以下文章

数据在内存中存放的顺序之字节序(附图解判断本机大小端程序及例题)建议收藏食用

ARM大小端格式,编译器决定还是CPU决定?

大端存储和小端存储

什么是大小端

字节序 —— Big Endian 和 Little Endian

关于大小端问题和字节序问题的一些总结