首页 > 解决方案 > 如何将模板函数传递给同一 .cpp 文件中的线程?

问题描述

我有一个任务来实现最长公共子序列算法的并行版本(仅计算 LCS 长度)。程序必须使用线程以尽可能快地完成任务(至少,比顺序实现更快)。理想情况下,它还应该在线程中使用 TLS。我们有一个类似的作业,在 .hpp 文件中实现了一个模板,我想使用相同的模板,但似乎我不能在这个作业中使用 .hpp 文件。我的问题在于将模板函数传递给我的线程。下面是代码:

#include <stdio.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <iostream>
#include <unistd.h>
#include <chrono>
#include <thread>
#include <functional>


#ifdef __cplusplus
extern "C" {
#endif

  void generateLCS(char* X, int m, char* Y, int n);
  void checkLCS(char* X, int m, char* Y, int n, int result);

#ifdef __cplusplus
}
#endif


class ParFor {
public:
template<typename TLS>
  void parfor(size_t beg, size_t endm, size_t endn, size_t increment,
           std::function<void(TLS&)> before,
           std::function<void(int, int, TLS&)> f,
           std::function<void(TLS&)> after
           ) {
    TLS tls;
    before(tls);
    for (size_t a=beg; a<endm; a+= increment) {
      for (size_t b=beg; b<endn; b+= increment) {
        f(a, b, tls);
      }
    }
    after(tls);
  }
};


int main (int argc, char* argv[]) {

  if (argc < 4) { std::cerr<<"usage: "<<argv[0]<<" <m> <n> <nbthreads>"<<std::endl;
    return -1;
  }

  int m = atoi(argv[1]);
  int n = atoi(argv[2]);
  int nbthreads = atoi(argv[3]);

  // get string data
  char *X = new char[m];
  char *Y = new char[n];
  generateLCS(X, m, Y, n);

  int result = 0; // length of common subsequence
  std::vector<std::thread> threads (nbthreads);
  int mSubset = m / nbthreads;
  int nSubset = n / nbthreads;
  ParFor pf;

  std::chrono::time_point<std::chrono::system_clock> start = std::chrono::system_clock::now();
    for(int j = 0; j < nbthreads; j++) {
            threads.push_back(std::thread(&ParFor::parfor, &pf, 0, mSubset, nSubset, 1,
                 [&](int& tls) -> void{
                   tls = result;
                 },
                 [&](int a, int b, int& tls) -> void{
                          if (X[a] == Y[b])
                            tls++;
                  },
                 [&](int tls) -> void{
                   result += tls;
                 }));
        }

    for(auto& t: threads)
            t.join();

  std::chrono::time_point<std::chrono::system_clock> end = std::chrono::system_clock::now();
  std::chrono::duration<double> elapsed_seconds = end-start;

  if(m < 10 || n < 10)
    result = 0;

  checkLCS(X, m, Y, n, result);

  std::cerr<<elapsed_seconds.count()<<std::endl;

  delete[] X;
  delete[] Y;

  return 0;
}

“类 ParFor”和从“int 结果”到最后的所有内容都是我添加的,其余的是来自 TA 的预先编写的代码。如果需要更多说明,请告诉我。谢谢你。

标签: c++multithreadingtemplatesparallel-processingheader-files

解决方案


你是对的,你不能像传递函数一样传递函数模板。它们是不同的东西,就像饼干切割器不是饼干一样。

您的代码中有两个主要问题。

首先,由于 ParFor::parfor 是一个模板,如果您提供的模板参数与您的 lambda 用于 TLS 的模板参数相匹配,则只能将成员函数指针指向它,因此将其更改为以下内容(例如):

&ParFor::parfor<int> 

您的第二个问题是尝试将 lambda 传递给函数模板,并期望推断说“这个 lambda 可以转换为 std::function,所以它是匹配的,从中推断”。对于推导,它需要完全匹配类型,并且 lambda 不是 std::function。如果传入 std::function 对象,那么它可以推导出模板参数。

因此,更改创建线程的循环以在传递 lambdas 之前对其进行包装,它将编译。你的代码中发生的事情太多了,我不想深入研究除此之外的细节,所以如果还有其他错误,这些仍然是你的。:)

for(int j = 0; j < nbthreads; j++) {
    threads.push_back(std::thread(
        &ParFor::parfor<int>, &pf, 0, mSubset, nSubset, 1,
        std::function{[&](int& tls) -> void{
            tls = result;
        }},
        std::function{[&](int a, int b, int& tls) -> void {
            if (X[a] == Y[b])
                tls++;
        }},
        std::function{[&](int tls) -> void{
            result += tls;
        }}));
    }

此外,指定您的 lambda 返回 void 的尾随返回类型是多余的。您可以简单地删除-> void而不更改任何内容。


推荐阅读