c++ - 如何使 perf_event_open() 中的 PERF_COUNT_SW_CONTEXT_SWITCHES 配置工作?
问题描述
我正在为我编写的软件设置分析,但我无法使用perf_event_open
.
为了测试这个问题,我也尝试使用提供的示例代码perf_event_open
man_page
。使用sched_yield
任务集在同一核心上使用和运行并行进程来强制上下文切换。使用上下文切换的计数perf_event_open()
仍然为 0。(使用 perf stat 时,我得到非零数字:对于大型循环,数以千计)。我也尝试过执行文件读取/使用 mmap 来强制页面错误。
#include <stdlib.h>
#include <stdio.h>
#include <unistd.h>
#include <string.h>
#include <sys/ioctl.h>
#include <linux/perf_event.h>
#include <asm/unistd.h>
#include <iostream>
#include <string.h>
#include <sys/mman.h>
using namespace std;
int buf_size_shift = 8;
static unsigned perf_mmap_size(int buf_size_shift)
{
return ((1U << buf_size_shift) + 1) * sysconf(_SC_PAGESIZE);
}
static long
perf_event_open(struct perf_event_attr *hw_event, pid_t pid,
int cpu, int group_fd, unsigned long flags)
{
int ret;
ret = syscall(__NR_perf_event_open, hw_event, pid, cpu,
group_fd, flags);
return ret;
}
int main(int argc, char **argv)
{
struct perf_event_attr pe;
long long count;
int fd;
memset(&pe, 0, sizeof(struct perf_event_attr));
pe.type = PERF_TYPE_SOFTWARE;
//pe.sample_type = PERF_SAMPLE_CALLCHAIN; /* this is what allows you to obtain callchains */
pe.size = sizeof(struct perf_event_attr);
pe.config = PERF_COUNT_SW_CONTEXT_SWITCHES;
pe.disabled = 1;
pe.exclude_kernel = 1;
pe.sample_period = 1000;
pe.exclude_hv = 1;
fd = perf_event_open(&pe, 0, -1, -1, 0);
if (fd == -1) {
fprintf(stderr, "Error opening leader %llx\n", pe.config);
exit(EXIT_FAILURE);
}
/* associate a buffer with the file */
struct perf_event_mmap_page *mpage;
mpage = (perf_event_mmap_page*) mmap(NULL, perf_mmap_size(buf_size_shift),
PROT_READ|PROT_WRITE, MAP_SHARED,
fd, 0);
if (mpage == (struct perf_event_mmap_page *)-1L) {
close(fd);
return -1;
}
ioctl(fd, PERF_EVENT_IOC_RESET, 0);
ioctl(fd, PERF_EVENT_IOC_ENABLE, 0);
printf("Measuring instruction count for this printf\n");
long long sum = 0;
for (long long i = 0; i < 10000000000; i++) {
sum += i;
if (i%1000000 == 0)
cout << i << " : " << sum << endl;
}
ioctl(fd, PERF_EVENT_IOC_DISABLE, 0);
read(fd, &count, sizeof(long long));
printf("Used %lld cs\n", count);
close(fd);
}
即使使用强制上下文切换,此代码也会在计数type = PERF_COUNT_SOFTWARE
中输出 0。config = PERF_COUNT_SW_CONTEXT_SWITCHES
而其他指标正在发挥作用。
在使用 mmap 环形缓冲区时,我看到PERF_RECORD_SWITCH
了读取它的记录,而据我了解,正在记录上下文切换事件。
任何有关性能计数和环形缓冲区中的数据如何相关的信息也值得赞赏。
解决方案
事件不计算在内,因为您禁用了内核 ( exclude_kernel = 1;
) 中的事件,并且PERF_TYPE_SOFTWARE
事件通常由内核提供。
如果您删除exclude_kernel
,事件将被计算在内。
计数和环形缓冲区中记录的事件之间的联系是sample_period
. 您的设置pe.sample_period = 1000;
意味着每 1000 个开关事件,PERF_RECORD_SAMPLE
就会将一个事件写入环形缓冲区。
以下读取缓冲区的示例仅用于说明一般方法。在实践中,您需要处理环绕缓冲区末尾的事件并进行更多的一致性检查。
auto tail = mpage->data_tail;
const auto head = mpage->data_head;
const auto size = mpage->data_size;
char* data = reinterpret_cast<char*>(mpage) + sysconf(_SC_PAGESIZE);
int events = 0;
while (true) {
if (tail >= head) break;
auto event_header_p = (struct perf_event_header*)(data + (tail % size));
std::cout << "event << " << event_header_p->type << ", size: " << event_header_p->size << "\n";
tail += event_header_p->size;
events++;
}
您应该在缓冲区中找到相应数量的类型事件PERF_RECORD_SAMPLE == 9
(除非发生溢出)。如果要阅读它们,则需要将指针转换为适当的结构。事件的实际布局(PERF_RECORD_SAMPLE
或任何其他事件)取决于您的perf_event_attr
配置,并记录在perf_event_open
.
推荐阅读
- excel - VBA:在大写短语的开头添加回车+换行
- mongodb - MongoDB 中用于电影票预订应用程序的一对多模型
- bixby - Bixby:页面可能为空警告
- python - 如何在没有框架的情况下使用 Core Python 创建 Web 应用程序?
- javascript - 如何检查乘法表jquery / javascript的数字是否上升
- reactjs - 从“反应”导入反应,{组件}
- java - 通知声音未在 Android 中播放
- html - 试图将 html 文件包含在另一个 html 文件中,会出现 CORS 错误
- html - 视差的页脚位置不合适
- java - 这段代码在哪里失败?两种方法之间的区别