如果平台上“long”和“int”的大小相同 - “long”和“int”有啥不同吗？

Posted 2023-03-11

技术标签:

【中文标题】如果平台上“long”和“int”的大小相同 - “long”和“int”有啥不同吗？【英文标题】：If the size of "long" and "int" are the same on a platform - are "long" and "int" different in any way?如果平台上“long”和“int”的大小相同 - “long”和“int”有什么不同吗？ 【发布时间】：2021-06-25 06:10:53 【问题描述】：

如果long int 和int 在平台上的表示相同，它们是否严格相同？根据 C 标准，这些类型在平台上的行为是否有任何不同？

例如。这总是有效吗：

int int_var;
long long_var;

void long_bar(long *l);
void int_bar(int *i);

void foo() 

    long_bar(&int_var); /* Always OK? */
    int_bar(&long_var);

我想同样的问题也适用于 short 和 int，如果它们恰好是相同的表示。

在讨论如何为没有 stdint.h 的嵌入式 C89 编译器定义类似 int32_t 的 typedef 时出现了问题，即作为 int 或 long 以及是否重要。

【问题讨论】：

不同的类型是不同的，即使它们的按位表示是相同的。你在做什么打破了严格的别名。您是从语言律师的角度提出问题（然后阅读n1570 或更好......）还是您关心在实践中 - 然后使用什么编译器和目标处理器？如果您的编译器是GCC，则将其用作gcc -Wall -Wextra 即使它们的大小相同，它们仍可能具有不同的范围，因为 C 允许类型具有陷阱表示和填充位。例如int 可以将 0x80000000 作为陷阱，但long 可以正常存储它。或者 int 可以有 2 个填充位，但 long 只有 1 个另一个例子是char、signed char、unsigned char 是 3 种不同的类型，它们的大小相同，但它们的范围也不同于 _Bool，_Bool 是另一种通常具有相同大小的类型使用 GCC，您可以编写自己的 GCC 插件来更改其行为。 GCC 和 Clang 都是开源编译器，你可以改进 【参考方案1】：

即使在long 和int 具有相同表示的平台上，标准也允许编译器故意忽略将值存储到long* 的行为可能会影响@ 值的可能性987654324@ 或反之亦然。给定类似的东西：

#include <stdint.h>

void store_to_int32(void *p, int index)

    ((int32_t*)p)[index] = 2;

int array1[10];
int test1(int index)

    array1[0] = 1;
    store_to_int32(array1, index);
    return array1[0];

long array2[10];
long test2(int index)

    array2[0] = 1;
    store_to_int32(array2, index);
    return array2[0];

32 位 ARM 版本的 gcc 会将 int32_t 视为 long 的同义词，并忽略将 array1 的地址传递给 store_to_int32 可能导致该数组的第一个元素被写入的可能性，而 32 位版本的 clang 会将 int32_t 视为 int 的同义词，并忽略将 array2 的地址传递给 store_to_int32 可能导致该数组的第一个元素被写入的可能性。

可以肯定的是，标准中的任何内容都不会禁止编译器以这种方式行事，但我认为标准未能禁止这种盲目性源于“越愚蠢，就越不需要禁止它”的原则”。

【讨论】：

【参考方案2】：

它们不是兼容的类型，你可以通过一个简单的例子看到：

int* iptr;
long* lptr = iptr; // compiler error here

所以在处理指向这些类型的指针时最重要的是。同样，有一个“严格的别名规则”使这段代码行为未定义：

int i;
long* lptr = (long*)&i;
*lptr = ...;  // undefined behavior

另一个微妙的问题是隐式提升。如果您有some_int + some_long，则该表达式的结果类型为long。或者，如果任一参数未签名，unsigned long。这是因为通过通常的算术转换进行整数提升，请参阅Implicit type promotion rules。大多数情况下应该没关系，但是这样的代码会失败：_Generic(some_int + some_long, int: stuff() )，因为表达式中没有long 子句。

通常，在类型之间分配值时，应该没有任何问题。在uint32_t 的情况下，它对应的类型并不重要，因为无论如何您都应该将uint32_t 视为单独的类型。我会选择long 与小型微控制器兼容，typedef unsigned int uint32_t; 会中断。（显然，typedef signed long int32_t; 是已签名的等价物。）

【讨论】：

@chux-ReinstateMonica：_Generic(some_int + some_long, int: stuff() ) 中没有 long 条目。 @chux-ReinstateMonica 签名与任何事情有什么关系？ unsigned int 在小型 MCU 上为 16 位。因此，如果您为 uint32_t 选择 unsigned int，您将定义一个 16 位的 uint32_t。我可能很迟钝，但是——您的“隐式提升”示例似乎并不是关于隐式提升；只需 _Generic(some_long, int: stuff() ) 或 _Generic(some_int, long: stuff() ) 就会遇到同样的问题。 @ruakh 关键是_Generic(some_int + some_int, int: stuff() ) 会起作用。通过在进行常规算术转换的表达式中引入long，我将类型更改为long，即使long 恰好与int 具有相同的大小。类似地，考虑_Generic( ... , int: stuff(), int32_t: stuff) 与_Generic( ... , long: stuff(), int: stuff)。当int32_t 实际上与int 的类型相同时，前者会产生编译器错误。但后者不会，因为它们是相同大小的独特类型。【参考方案3】：

long 和 int 类型有不同的等级。 long 类型的等级高于int 类型的等级。因此，在使用long 类型的对象和int 类型的对象的二进制表达式中，最后一个总是转换为long 类型。

比较下面的代码sn-ps。

int x = 0;
unsigned int y = 0;

表达式x + y的类型是unsigned int。

long x = 0;
unsigned int y = 0;

如果sizeof( int ) 等于sizeof( long)，则表达式x + y 的类型是unsigned long（由于通常的算术转换）。

这在 C++ 中比在允许函数重载的 C 中非常重要。

在 C 中，您必须考虑到这一点，例如当您使用 i/o 函数（例如 printf）来指定正确的转换说明符时。

【讨论】：

以上是关于如果平台上“long”和“int”的大小相同 - “long”和“int”有啥不同吗？的主要内容，如果未能解决你的问题，请参考以下文章