首页 > 解决方案 > 如何找到此 Web 可下载 .csv 文件的地址?

问题描述

如果我去这个网站:

https://covid.cdc.gov/covid-data-tracker/#ed-visits

并单击“下载”按钮(右侧),下载一个 .csv 文件。

我找不到那个 csv 文件的地址,所以我可以用 pd.read_csv() 自动获取它。我对网络检查员的事情进行了窥探,但我真的不知道我在做什么,而且没有什么是显而易见的答案。我还查看了其他各种站点,试图找到一个 API 可以让我访问这些数据,但似乎没有这样的东西。

任何人都可以帮助我吗?

非常感谢!

标签: pythonhtmlcsv

解决方案


您可能想要打开您的网络检查器并转到“网络”-选项卡,然后重新加载页面。您将看到,实际上从未加载过 csv。导出按钮也没有链接到任何文件。相反,它有一些 javascript 绑定,可以将客户端(浏览器)中的现有数据作为 csv 导出到文件系统。换句话说:该文件没有地址。它是在您的浏览器中创建的。

所以更好的是,你可以直接读取 json。只需在 Network-Tab 中找到正确的数据,我认为可能是这样的:https ://covid.cdc.gov/covid-data-tracker/COVIDData/getAjaxData?id=ed_trend_data

因此,您可以直接读取 json: pd.read_json('https://covid.cdc.gov/covid-data-tracker/COVIDData/getAjaxData?id=ed_trend_data'),然后过滤您需要的数据。


推荐阅读