low-latency - 用于估计启用 NUMA 的改进的 Memory Profiler 工具
问题描述
我在一个低延迟的应用程序上工作,我认为它会从启用 NUMA 中受益匪浅(或者无论如何改善内存局部性)。
是否有一个分析工具可以让我估计可以改进的地方,也许是减少执行时间的百分比/因素?
我正在考虑使用cachegrind。我预计会有很多 LL 缓存未命中,但我仍然不知道预期的改进。
非常感谢。
编辑:这里的目标是试图减少延迟。目前,有一个线程在启动时工作并执行所有分配。我相信,一个更好的实现是将线程固定到 cpu 内核,并使每个线程都进行所需的分配。在此之前,我想以某种方式估计延迟方面的好处。
解决方案
推荐阅读
- javascript - FileReader onload 并在循环中赋值?
- pine-script - Pine 脚本:如果 x -> 百分比停止 else -> ATR 停止
- java - 通过 java swing 实现快速排序可视化
- aspnetboilerplate - DI 中的 Masstransit unti 测试问题和 ISendEndpointProvider
- python - Qt 样式表破坏了 PyQt5 应用程序的功能
- python - 使用日期时间填写列表中缺失月份的最佳方法是什么?
- docker - 使用 docker 构建 Jekyll 并使用 nginx 服务
- xpath - python selenium 如何在 XPath 1.0 中处理动态 XPath
- angular - Jest 测试在 CLI 中运行良好,但在 IntelliJ 中失败
- c# - 如何在存储库类中使用 IAsyncEnumerable