python - 如何用 Python 从 NHC 网站中提取表格?
问题描述
这里,
https://www.nhc.noaa.gov/gis/
“数据和产品”部分下有一个表格。我想提取表格并将其保存到 CSV 文件中。我写了这个基本代码:
from bs4 import BeautifulSoup
import requests
page = requests.get("https://www.nhc.noaa.gov/gis/")
soup = BeautifulSoup(page.content, 'html.parser')
print(soup)
我只知道刮的基础知识。请从这里引导我。谢谢!
解决方案
你可以使用熊猫
import pandas as pd
url = 'https://www.nhc.noaa.gov/gis/'
df = pd.read_html(url)[0]
# create csv file
df.to_csv("mycsv.csv")
推荐阅读
- xml - XCAP xml 格式
- qr-code - Zebra ZPL II 代码可缩放 QR 代码 (^BQ)
- java - 使用 lombok 时设置 log4j 级别
- bash - 使用 bash 脚本创建 gzip 文件
- oracle - 为什么在我的 AutoField 模型中指定主键时必须明确指定主键?
- python - 双计数循环(n*n 代码性能)
- python - 将多个以字符串开头的csv文件读入python中的单独数据帧
- javascript - Post 请求中传递的数据太大,需要在单个请求中传递,我们可以将其拆分为多个调用吗
- amazon-web-services - 如何在我的 beanstalk ec2 环境中安装 phpmyadmin
- javascript - 根据输入的值将阈值线动态插入到 d3.js 条形图中