首页 > 解决方案 > 有没有办法将具有特定关键字的 Github 存储库的所有问题/提交提取到 csv 文件?

问题描述

我正在尝试从提交/问题页面上具有特定消息/单词的存储库(例如:Tensorflow)中提取问题。例如,我想从 Tensorflow 存储库中提取所有包含单词 CVE 的提交/问题,并将它们放入 CSV 文件中进行分析。

我试过 curl "https://api.github.com/repos/tensorflow/tensorflow/issues" 但它只返回前 30 个问题而不是全部。

我看过 Github API,但我不太了解。请帮忙!

标签: gitgithub

解决方案


结果是分页的,有两个参数per_pagepage问题 API:

per_page  integer    Results per page (max 100). Default: 30
page      integer    Page number of the results to fetch. Default: 1

将这些与您的查询一起传递。

文档链接:
https ://docs.github.com/en/rest/reference/issues#list-issues-assigned-to-the-authenticated-user


列出提交:只需克隆 repo 并使用常规 git 命令列出提交(git log使用正确的选项)


推荐阅读