c++ - 同时使用多个线程c ++
问题描述
我在为我的madelbrot 程序使用多个线程时遇到问题。
我厌倦了教程的一种方式
int sliceSize = 800 / threads;
double start = 0, end = 0;
for (int i = 0; i < threads; i++)
{
start = i * sliceSize;
end = ((1 + i) * sliceSize);
thrd.push_back(thread(compute_mandelbrot, left, right, top, bottom, start, end));
}
for (int i = 0; i < threads; i++)
{
thrd[i].join();
}
thrd.clear();
但是代码只需要一半的时间来计算,同时使用 8 个线程。
我也尝试了一些更复杂的东西,但它根本不起作用
void slicer(double left, double right, double top, double bottom)
{
/*promise<int> prom;
future<int> fut = prom.get_future();*/
int test = -1;
double start = 0, end = 0;
const size_t nthreads = std::thread::hardware_concurrency(); //detect how many threads cpu has
{
int sliceSize = 800 / nthreads;
std::cout << "CPU has " << nthreads << " threads" << std::endl;
std::vector<std::thread> threads(nthreads);
for (int t = 0; t < nthreads; t++)
{
threads[t] = std::thread(std::bind(
[&]()
{
mutex2.lock();
test++;
start = (test) * sliceSize;
end = ((test + 1) * sliceSize);
mutex2.unlock();
compute_mandelbrot(left, right, top, bottom, start, end);
}));
}
std::for_each(threads.begin(), threads.end(), [](std::thread& x) {x.join(); }); //join threads
}
}
但似乎当它一次计算 8 个东西时,即使使用互斥体,它们也往往会重叠,而且速度并没有更快。
在过去的 7 小时里,这让我很头疼,我想自杀。帮助。
解决方案
当您尝试通过多线程加速工作负载时,有很多事情在起作用,而在完美的世界中,几乎不可能在乘以 N 个线程时获得 Nx 加速。需要记住的一些事项:
- 如果您正在使用超线程(因此在系统上每个虚拟核心使用 1 个线程,而不仅仅是每个物理核心),那么您将无法获得与 2 个真实核心相同的性能 - 您将获得一些百分比(可能约为1.2 倍左右)。
- 操作系统 (Windows) 将在您的工作负载执行时执行操作。这些操作系统任务在什么时候以及什么时候占用你的应用程序时间是相当随机的,但它会有所作为。总是期望你的CPU时间的一部分会被windows偷走。
- 任何类型的同步都会严重影响性能。在您的第二个示例中,互斥量非常大,可能会影响性能。
- 内存访问、缓存访问等将发挥作用。多个线程在各处访问内存将对缓存造成压力,这将产生(潜在的)影响。
我很好奇——你在看什么时候?你在每个线程上传递了多少次迭代?要深入了解时间方面发生了什么,您可以尝试使用 queryPerformanceCounter 记录每个线程的开始/结束时间,以查看每个线程的运行时间、启动时间等。在此处发布 1、2 的时间, 4 和 8 线程可能会有所启发。
希望这至少有一点帮助......
推荐阅读
- php - 在自定义帖子类型中显示已创建类别的帖子
- css - 将 li 元素无序移动到末尾
- javascript - 如何使用谷歌脚本连接每行中的单元格?
- amazon-web-services - 使用 for_each 与资源的 Terraform 相关性
- django - Django 使用表单内的表单验证图像或文件
- node.js - Telegram webhook 集成以表达应用程序
- javascript - 如何在 Material UI 中向 SearchAppBar 添加搜索功能?
- windows - 为 URLMON_OPTION_USERAGENT 调用 UrlMkGetSessionOption 总是返回 E_OUTOFMEMORY
- sql - 在 SQL 中查找最接近的匹配项
- javascript - 寻求有关嵌套 jsx 组件中的 onclick 侦听器的解释