c++ - C++17 std::variant 比动态多态性慢?
问题描述
我正在关注这个博客,并试图将动态多态性代码替换为使用std::variant
and std::visit
。但我无法让std::variant
+std::visit
比虚拟结构 impl 更好地工作。它慢了大约1.3-1.5 倍!(GCC 10.3 -O3 C++17)
用例如下。假设我们正在比较两个表的第 i 行和第 j 行。表可能具有异构类型的列。假设我们可以访问列缓冲区。我正在做的是测试,
def IndexEqual(Table:A, Table:B, int:i, int:j):
for c in range(A.num_cols):
if not A.column(c)[i] == B.column(c)[j]:
return False
return True
对于动态多态性,我有以下int
和float
struct Comp{
virtual bool comp(size_t i, size_t j) const = 0;
};
struct CompI: public Comp {
CompI(const int *data_1, const int *data_2) : data1(data_1), data2(data_2) {}
const int *data1, *data2;
bool comp(size_t i, size_t j) const override {
return data1[i] == data2[j];
}
};
struct CompF: public Comp {
CompF(const float *data_1, const float *data_2) : data1(data_1), data2(data_2) {}
const float *data1, *data2;
bool comp(size_t i, size_t j) const override {
return data1[i] == data2[j];
}
};
bool IndexEqual1(const std::vector<Comp *> &comps, size_t i, size_t j) {
for (auto &&a: comps) {
if (!a->comp(i, j)) {
return false;
}
}
return true;
}
这被转换为std::variant
+std::visit
如下。
struct EqualToI {
EqualToI(const int *data_1, const int *data_2) : data1(data_1), data2(data_2) {}
const int *data1, *data2;
bool comp(size_t i, size_t j) const {
return data1[i] == data2[j];
}
};
struct EqualToF {
EqualToF(const float *data_1, const float *data_2) : data1(data_1), data2(data_2) {}
const float *data1, *data2;
bool comp(size_t i, size_t j) const {
return data1[i] == data2[j];
}
};
using var_type = typename std::variant<EqualToI, EqualToF>;
bool IndexEqual(const std::vector<var_type> &comps, size_t i, size_t j) {
for (auto &&a: comps) {
if (!std::visit([&](const auto &comp) {
return comp.comp(i, j);
}, a)) {
return false;
}
}
return true;
}
我在这里进行了基准测试 https://quick-bench.com/q/u-cBjg4hyQjOs6fKem9XSdW7LMs
有人可以解释为什么这个std::variant
+std::visit
选项比动态多态方法慢吗?我期待否则!我的方法和/或基准有问题吗?
解决方案
使用variant
不构成“静态多态性”。它仍然是动态多态性,因为编译器不知道哪种类型将实际存在于variant
. 因此,有问题的代码必须尝试找出variant
运行时存储的内容,并且必须相应地调度这些调用。
请注意,您链接到的文章也没有将其称为“静态多态性”。它强调它只是与虚函数不同形式的“运行时多态性”。
推荐阅读
- python - Lengend 与 pandas 中的图形重叠
- elasticsearch - 字符串搜索 Elasticsearch 中的确切位置
- android - 屏幕关闭时,Android 10 会阻止网络请求和 GPS 呼叫
- sql - Databricks:如何在 %SQL QUERY 中获取集群标签
- c++ - 如何编写一个输入和输出都是 std::variant 的函数
- python - Selenium 按类名查找元素返回错误信息
- r - 通过 R 中的两个匹配列连接两个数据集
- amazon-web-services - Route53 更改尚未在 AWS lambda 中生效
- javascript - Selenium JSExecutor - 从 Amcharts 条形气泡中获取价值
- android - 如何使用 FCM + 数据消息从后台打开 Flutter 应用程序?