首页 > 解决方案 > 实践中的联合、别名和类型双关:什么有效,什么无效?

问题描述

我很难理解使用带有 GCC 的联合可以做什么和不可以做什么。我阅读了有关它的问题(特别是此处此处),但它们侧重于 C++ 标准,我觉得 C++ 标准与实践(常用编译器)之间存在不匹配。

特别是,我最近在阅读有关编译标志-fstrict-aliasing的GCC 在线文档中发现了令人困惑的信息。它说:

-fstrict-aliasing

允许编译器采用适用于正在编译的语言的最严格的别名规则。对于 C(和 C++),这会根据表达式的类型激活优化。特别是,假设一种类型的对象永远不会与不同类型的对象驻留在相同的地址,除非类型几乎相同。例如, anunsigned int可以别名 an int,但不能为 avoid*或 a double。字符类型可以为任何其他类型起别名。特别注意这样的代码:

union a_union {
  int i;
  double d;
};

int f() {
  union a_union t;
  t.d = 3.0;
  return t.i;
}

从不同的工会成员那里阅读而不是最近写入的成员(称为“类型双关语”)的做法很常见。即使使用 -fstrict-aliasing,也允许使用类型双关语,前提是通过联合类型访问内存。因此,上面的代码按预期工作。

这就是我认为我从这个例子和我的怀疑中理解的:

1)别名仅适用于相似类型或 char

1) 的后果:别名——顾名思义——是当你有一个值和两个成员来访问它时(即相同的字节);

疑问:当它们具有相同的字节大小时,两种类型是否相似?如果不是,类似的类型是什么?

1) 的后果对于不相似的类型(无论这意味着什么),别名不起作用;

2)类型双关语是当我们读到的成员与我们写给的成员不同时;这很常见,只要通过联合类型访问内存,它就可以按预期工作;

怀疑:别名是类型相似的类型双关语的特定情况吗?

我很困惑,因为它说 unsigned int 和 double 不相似,所以别名不起作用;然后在示例中,它是 int 和 double 之间的别名,它清楚地表明它按预期工作,但称其为类型双关语:不是因为类型相似或不相似,而是因为它是从它没有写入的成员中读取的。但是从它没有写的成员那里读取是我理解别名的用途(正如这个词所暗示的那样)。我迷路了。

问题: 有人可以澄清别名和类型双关之间的区别以及这两种技术的哪些用途在 GCC 中按预期工作?编译器标志有什么作用?

标签: c++gccstrict-aliasing

解决方案


别名可以从字面上理解它的含义:当两个不同的表达式引用同一个对象时。类型双关是“双关”一种类型,即将某种类型的对象用作不同类型。

形式上,类型双关语是未定义的行为,只有少数例外。当您不小心摆弄比特时,通常会发生这种情况

int mantissa(float f)
{
    return (int&)f & 0x7FFFFF;    // Accessing a float as if it's an int
}

例外情况是(简化)

  • 访问整数作为它们的无符号/有符号对应物
  • char,unsigned charstd::byte

这被称为严格别名规则:编译器可以安全地假设两个不同类型的表达式永远不会引用同一个对象(上述例外除外),因为否则它们将具有未定义的行为。这有助于优化,例如

void transform(float* dst, const int* src, int n)
{
    for(int i = 0; i < n; i++)
        dst[i] = src[i];    // Can be unrolled and use vector instructions
                            // If dst and src alias the results would be wrong
}

gcc 说的是它稍微放宽了规则,并允许通过联合进行类型双关,即使标准不要求它

union {
    int64_t num;
    struct {
        int32_t hi, lo;
    } parts;
} u = {42};
u.parts.hi = 420;

这是类型双关语 gcc 保证将起作用。其他情况可能看起来有效,但有一天可能会默默地被打破。


推荐阅读