首页 > 解决方案 > 使用 Git 和 Github 仅下载文件的“差异”?

问题描述

我正在制作一个 Python 程序,该程序使用Our World In Data 的.json 格式的疫苗接种数据在世界地图上可视化 Covid 疫苗接种数据。我想介绍一个功能,程序从 OWID 的 Github 下载最新的 .json 文件并替换旧文件,前提是这两个文件的“最后修改”日期之间至少有 24 小时的差异。

我的问题是我是否可以利用 Git/Github 的功能来快速比较本地文件和远程文件的内容,并且下载两者之间不同的内容,以减少必须下载的内容的大小。最终目标是使用尽可能少的带宽/时间来下载文件的新版本。

标签: pythonjsongitgithub

解决方案


你可以通过直接使用 Git 来非常干净地做到这一点:保留存储库的本地克隆,然后运行git pull以获取最新更新。像这样的命令git fetch; git status可以事先告诉您您是否不同步。Git 已针对尽可能高效地拉取文件更新进行了优化。


推荐阅读