首页 > 解决方案 > 用于估计启用 NUMA 的改进的 Memory Profiler 工具

问题描述

我在一个低延迟的应用程序上工作,我认为它会从启用 NUMA 中受益匪浅(或者无论如何改善内存局部性)。

是否有一个分析工具可以让我估计可以改进的地方,也许是减少执行时间的百分比/因素?

我正在考虑使用cachegrind。我预计会有很多 LL 缓存未命中,但我仍然不知道预期的改进。

非常感谢。

编辑:这里的目标是试图减少延迟。目前,有一个线程在启动时工作并执行所有分配。我相信,一个更好的实现是将线程固定到 cpu 内核,并使每个线程都进行所需的分配。在此之前,我想以某种方式估计延迟方面的好处。

标签: low-latencymemory-profilingnuma

解决方案


推荐阅读