python - 如何使用 Python 从 AWS 机器访问 Github 中的 Excel 数据
问题描述
我有一个 excel 文件放在 Github 中,Python 安装在 AWS 机器上。我想使用 Python 脚本从 AWS 机器上读取 excel 文件。你能帮我实现这一目标吗?到目前为止,我使用下面的代码来实现这一点......
#Importing required Libraries
import pandas as pd
import xlwt
import xlrd
#Formatting WLM data
URL= 'https://github.dev.global.tesco.org/DotcomPerformanceTeam/Sample-WLM/blob/master/LEGO_LIVE_FreshOrderStableProfile_2019_v0.1.xlsx'
data = pd.read_excel(r"URl", sheet_name='WLM', dtype=object)
当我执行此操作时,我遇到了错误
IOError: [Errno 2] No such file or directory: 'URl'
解决方案
您可以使用 de Wget 命令从 GitHub 下载文件。这里的关键是使用原始版本链接,否则您将下载一个 html 文件。要获取原始链接,请单击您在 GitHub 上上传的文件,然后右键单击原始按钮并选择保存路径或复制路径。最后你可以用它来下载文件,然后用 pd.read_excel("Your Excel file URL or disk location") 读取它。例子:
#Raw link: https://raw.github.com/<username>/<repo>/<branch>/Excelfile.xlsx
!wget --show-progress --continue -O /content/Excelfile.xlsx https://raw.github.com/<username>/<repo>/<branch>/Excelfile.xlsx
df = pd.read_excel("content/Excelfile.xlsx")
注意:此示例适用于 Colab,如果您使用的是本地环境,请不要使用感叹号。您还可以在此处找到更多想法:从 GitHub 下载单个文件
推荐阅读
- django - Django 设置是否在 uwsgi 工作人员之间共享?
- excel - Excel 连接 - 编辑链接不起作用?
- python-3.x - 寻找通过多个函数传入变量的简单方法
- swift - 以编程方式禁用mac os x中的内置键盘?
- excel - 选择正确的私人子
- rstudio - 将 pandoc 从 1.19 更新到 2.4 后,R markdown pandoc 文档转换失败,错误 1
- css - 尝试创建像文本框这样的材料设计,输入验证问题
- generics - 不正确的 json.net 序列化
- java - Java fx 更改字符串的颜色
- pandas - Pandas 导出 to_csv() 并在列名周围加上引号