首页 > 解决方案 > 给定包含要切片的索引的向量,是否有一种有效的方法来切片 C++ 向量

问题描述

我正在努力实现一个用 MATLAB 编写成 C++ 的代码。

在 MATLAB 中,您可以将一个数组与另一个数组(如 A(B))进行切片,这会在 B 中元素的值指定的索引处生成一个 A 元素的新数组。

我想在 C++ 中使用向量做类似的事情。这些向量的大小为 10000-40000 个 double 类型的元素。

我希望能够使用另一个包含要切片的索引的 int 类型的向量来切片这些向量。

例如,我有一个向量 v = <1.0, 3.0, 5.0, 2.0, 8.0> 和一个向量 w = <0, 3, 2>。我想使用 w 对 v 进行切片,使得切片的结果是一个新向量(因为旧向量必须保持不变)x = <1.0, 2.0, 5.0>。

我想出了一个功能来做到这一点:

template<typename T>
std::vector<T> slice(std::vector<T>& v, std::vector<int>& id) {

    std::vector<T> tmp;
    tmp.reserve(id.size());

    for (auto& i : id) {
        tmp.emplace_back(v[i]);
    }

    return tmp;
}

我想知道是否有可能更有效的方法来完成这样的任务。速度是这里的关键,因为这个切片函数将处于一个大约有 300000 次迭代的 for 循环中。我听说 boost 库可能包含一些有效的解决方案,但我还没有使用它的经验。

我使用 chrono 库来测量调用此切片函数所需的时间,其中要切片的向量长度为​​ 37520,包含索引的向量大小为 1550。对于此函数的单次调用,经过的时间 = 0.0004284s . 然而,超过 300000 次 for 循环迭代,总运行时间为 134 秒。

任何建议都会非常感激!

标签: c++vectorboostslice

解决方案


emplace_back有一些开销,因为它涉及内部的一些内部会计std::vector。试试这个:

template<typename T>
std::vector<T> slice(const std::vector<T>& v, const std::vector<int>& id) {

    std::vector<T> tmp;
    tmp.resize (id.size ());

    size_t n = 0;
    for (auto i : id) {
        tmp [n++] = v [i];
    }

    return tmp;
}

此外,我在您的内部循环中删除了不必要的取消引用。


编辑:我对此进行了更多思考,并受到@jack 回答的启发,我认为内部循环(这是最重要的)可以进一步优化。这个想法是将循环使用的所有内容都放在局部变量中,这为编译器提供了优化代码的最佳机会。所以试试这个,看看你得到了什么时间。确保您测试发布/优化构建:

template<typename T>
std::vector<T> slice(const std::vector<T>& v, const std::vector<int>& id) {

    size_t id_size = id.size ();
    std::vector<T> tmp (id_size);
    T *tmp_data = tmp.data ();

    const int *id_data = id.data ();
    const T* v_data = v.data ();

    for (size_t i = 0; i < id_size; ++i) {
        tmp_data [i] = v_data [id_data [i]];
    }

    return tmp;
}

推荐阅读