首页 > 解决方案 > 用 c++17 算法并行化一个简单的循环

问题描述

我有一个并行代码,基本上可以简化为:

#include <algorithm>
#include <vector>

struct TKeyObjPtr;

class TObj
{
public:
  virtual void Calculate(TKeyObjPtr const &) = 0;
};

struct TKeyObjPtr
{
  int Key;
  TObj *ObjPtr;
};

void Calculate(std::vector<TKeyObjPtr> const &KeyObjPtrVec)
{
  #pragma omp parallel for
  for (auto It1= KeyObjPtrVec.begin(); It1!=KeyObjPtrVec.end(); ++It1)
    for (auto It2= It1+1; It2!=KeyObjPtrVec.end() && It2->Key==It1->Key; ++It2)
      It1->ObjPtr->Calculate(*It2);
}

我想通过使用并行算法对该代码进行现代化改造。不幸的是,我在重写这么简单的一段代码时遇到了麻烦。

一个选项是使用boost::counting_iterator

void Calculate(std::vector<TKeyObjPtr> const &KeyObjPtrVec)
{
  std::for_each(std::execution::par_unseq,
    boost::counting_iterator<std::size_t>(0u),
    boost::counting_iterator<std::size_t>(KeyObjPtrVec.size()),
    [&KeyObjPtrVec](auto i)
      {
        for (auto j= i+1; j<KeyObjPtrVec.size() && KeyObjPtrVec[j].Key==KeyObjPtrVec[i].Key; ++j)
          KeyObjPtrVec[i].ObjPtr->Calculate(KeyObjPtrVec[j]);
      });
}

这可行,但要冗长得多,更糟糕的是,我认为它不符合标准,因为boost::counting_iterator它是一个存储迭代器,因此不符合Cpp17ForwardIterator要求

是否可以像使用 OpenMP 一样简洁地编写上述代码,同时满足标准对并行算法的约束?

标签: c++iteratorc++17stl-algorithm

解决方案


迭代器可以按值赋值。分配的迭代器是一个副本,当原始分配源增加时不会前进。因此,您可以简单地

template<typename I>
void calculate(const I It1, const I It2) {
  // This statement can also run at any time later. The iterators will point
  // how they were when the calculate(...) was called.
  It1->ObjPtr->Calculate(*It2); 
}

void Calculate(std::vector<TKeyObjPtr> const &KeyObjPtrVec) {
  for (auto It1 = KeyObjPtrVec.begin(); It1 != KeyObjPtrVec.end(); ++It1)
    for (auto It2 = It1 + 1; It2 != KeyObjPtrVec.end() && 
      It2->Key == It1->Key; ++It2)
        calculate(It1, It2);
}

不幸的是,C++17 并不是一个专用的并行编程平台。您需要安排一个有意义大小的线程池和任务队列,他们可以从中挑选任务。任务记录可以只保存分配为结构字段的这两个迭代器。您还需要一种机制来了解所有并行处理何时完成,以便您可以继续。


推荐阅读