python - 使用 Git 和 Github 仅下载文件的“差异”?
问题描述
我正在制作一个 Python 程序,该程序使用Our World In Data 的.json 格式的疫苗接种数据在世界地图上可视化 Covid 疫苗接种数据。我想介绍一个功能,程序从 OWID 的 Github 下载最新的 .json 文件并替换旧文件,前提是这两个文件的“最后修改”日期之间至少有 24 小时的差异。
我的问题是我是否可以利用 Git/Github 的功能来快速比较本地文件和远程文件的内容,并且只下载两者之间不同的内容,以减少必须下载的内容的大小。最终目标是使用尽可能少的带宽/时间来下载文件的新版本。
解决方案
你可以通过直接使用 Git 来非常干净地做到这一点:保留存储库的本地克隆,然后运行git pull
以获取最新更新。像这样的命令git fetch; git status
可以事先告诉您您是否不同步。Git 已针对尽可能高效地拉取文件更新进行了优化。
推荐阅读
- html - Angular / ng-bootstrap 日期时间格式
- jquery - 覆盖使用自定义数据属性的 jquery 插件
- java - Java spring @Value 注解
- android - 如何在 Android 中播放 avi 流?
- r - 如何引用一个表达式,其中包含对引用和取消引用字符串的调用?
- neo4j - 在数组属性值中查找特定字符串
- php - 如何运行长循环需要超过允许的最大执行时间
- angular - dialogref.afterclosed() 结果为空 Angular 8
- objective-c - UIScrollView:我可以将手指滚动运动从一个滚动视图重定向到另一个滚动视图吗?
- javascript - 在显示 HTML 之前检查 JS 值是否存在