python - 下载文件 raw.githubusercontent.com 非常慢
问题描述
我正在 python 3 中构建一个应用程序,需要从 raw.githubusercontent.com 下载一大堆 *.java 文件。基本上,我使用 GitHub 的 API v3 来获取给定存储库中以“.java”结尾的所有路径,然后通过 raw.githubusercontent.com 下载它们。问题是这真的很慢(< 10 kB/s)。现在有时,它以一个不错的速度开始(40-50 kB/s),但随后它通常会很快下降。
我尝试使用 requests.Session() 保持持久连接。我也尝试过使用有人建议的授权令牌。这两个都没有改善。
这就是我的代码的样子:
with requests.Session() as s:
path_index = ""
for path in paths.splitlines():
file_url = githubusercontent_prefix + path
filename = path.split("/")[-1]
res = s.get(file_url, stream=True, allow_redirects=True)
outf = open("sources/" + filename, 'w')
outf.write(res.text)
outf.close()
解决方案
推荐阅读
- javascript - 当 html 包含脚本标签时,monaco.editor.colorize 抛出异常
- javascript - 访问位置 [i] 处的 json 元素并在地图函数中更改它们的值
- python - 检查一个treeNode是否是另一个节点的祖先
- c++ - C++程序服务
- vbscript - 任务杀手脚本问题
- android - 如何在单击上传按钮时显示带有标题选择和选项相机、画廊和取消的对话框或操作表?
- pycharm - PyCharm 经常无法恢复其主窗口最大化
- java - 春季启动中“加载弹性搜索节点失败”?
- php - 通过 ssh 执行的 php 脚本不起作用,但通过浏览器工作
- javascript - 将默认导出和命名导出与汇总混合