首页 > 解决方案 > C中结构的大小与重新排列的变量不同

问题描述

我试图看看为什么当我移动结构变量时结构的大小会有所不同,我知道涉及到填充,但它在后台做什么并不明显

struct test1 {
    long y;
    int a;
    short int b;
    short int t;
}

sizeof(struct test1) = 16

struct test2 {
    long y;
    short int b;
    int a;
    short int t;
}

sizeof(struct test2) = 24

struct test3 {
    int a;
    long y;
    short int b;
    short int t;
}

sizeof(struct test3) = 24

我知道 test1 的大小是 8 + (4+2+2) 没有填充,但我不明白为什么 test2 不返回相同的结果,8 + (2+4+2) 没有填充。

第三个 test3 我们看到 int 需要 4bytes + 4 padding,long 需要 8 bytes,short int 需要 2bytes + 2bytes + 4 padding。

如果test3可以让两个short int变得连续,那么为什么test2不让short int、int和short int变得连续呢?

另外,这是否意味着我们应该始终确保重新排序结构成员以最小化填充?

那么与 test2 和 test3 相比,test1 总是更好地声明?

编辑:作为跟进,

struct test4 {
    char asdf[3];
    short int b;
};

sizeof(struct test4) = 6

不应该将 short int 填充到 4 个字节,因为数组大小为 3 的 char 填充到 4 个字节?

标签: cstructpadding

解决方案


背景中发生的事情是对齐。对齐是要求数据类型具有可被某个单元整除的地址。如果该对齐单元是类型本身的大小,则这是符合 C 的实现中存在的最严格的对齐。

C 编译器倾向于确保结构布局中的某些对齐,即使要求不是来自目标硬件。

如果我们有一个long,即 4 个字节,后跟一个 2 个字节short,它short可以紧跟在 之后long,因为 4 个字节的偏移量对于两个字节类型来说已经足够对齐了。这两个成员之后的偏移量是 6。但是你的编译器不认为 6 是 4 字节的合适对齐int;它想要 4 的倍数。插入两个字节的填充以将其移动int到偏移量 8。

当然,实际数字是特定于编译器的。您必须知道类型的大小以及对齐要求和规则。

另外,这是否意味着我们应该始终确保重新排序结构成员以最小化填充?

如果最小结构大小在您的应用程序中很重要,那么您必须将成员从最严格对齐到最不严格对齐。如果最小结构大小不重要,那么您不必关心这一点。

其他问题可能会影响,例如与外部强加布局的兼容性。

或增量增长。如果随着时间的推移跨多个版本维护一个公共使用的结构(由许多编译代码实例引用,例如可执行文件和动态库),通常只能在最后添加新成员。在这种情况下,即使我们愿意,我们也不会得到最小尺寸的最佳订单。

不应该将 short int 填充到 4 个字节,因为数组大小为 3 的 char 填充到 4 个字节?

不,因为char [4]数组后面的一字节填充使偏移量变为 4。该偏移量对于放置两字节短字节来说已经足够对齐了。此外,在那之后不需要填充。为什么?short 之后的偏移量是 6。结构中最严格对齐的成员是该 short,对齐要求是 2。6 可以被 2 整除。

在这种情况下,在两字节 short: 之后需要对齐 struct { long x; short y; }。说long是4个字节。或者,让我们把它设为 8,没关系。如果我们将 2 字节short放在 8 字节之后long,我们的大小为10. 如果我们声明这个结构的数组a,就会出现问题,因为a[1].x将在10数组底部的偏移处:x未对齐。最严格对齐的结构成员是x,对齐要求为(例如)8,与其大小相同。因此,为了数组对齐,必须填充结构以使其大小可被 8 整除。因此,最后需要 6 个字节的填充才能使大小达到 16。

基本上,成员之前的填充是为了它自己的对齐,而在结构末尾的填充是为了确保所有成员在数组中对齐,并且由最严格对齐的成员驱动。

在某些平台上,对齐是硬硬件要求!例如,如果在不能被 4 整除的地址上访问四字节数据类型,则会发生 CPU 异常。在一些这样的平台上,CPU 异常可以由操作系统来处理,它在软件中实现了未对齐的访问,而不是将潜在的致命信号传递给进程。这种访问非常昂贵,可能需要数百条指令。我似乎记得在 Linux 的 MIPS 端口中,这是一个每个进程的选项:可以为一些依赖它但未打开的非便携式程序(例如为 Intel x86 开发的程序)打开处理未对齐的异常对于由于某些损坏错误而仅执行未对齐访问的程序(例如,未初始化的指针幸运地指向有效内存,但地址未对齐)。

在某些平台上,硬件会处理未对齐的访问,但与对齐的访问相比,仍然要付出一定的代价。例如,可能必须进行两次内存访问而不是一次。

C 编译器在分配结构成员和变量时倾向于强制对齐,即使对于不强制对齐的目标机器也是如此。这可能是出于各种原因,例如性能和兼容性。


推荐阅读