首页 > 解决方案 > 如何用 Python 从 NHC 网站中提取表格?

问题描述

这里,

https://www.nhc.noaa.gov/gis/

“数据和产品”部分下有一个表格。我想提取表格并将其保存到 CSV 文件中。我写了这个基本代码:

from bs4 import BeautifulSoup
import requests
page = requests.get("https://www.nhc.noaa.gov/gis/")
soup = BeautifulSoup(page.content, 'html.parser')
print(soup)

我只知道的基础知识。请从这里引导我。谢谢!

标签: pythonpython-3.xweb-scrapingbeautifulsoup

解决方案


你可以使用熊猫

import pandas as pd

url = 'https://www.nhc.noaa.gov/gis/'
df = pd.read_html(url)[0]

# create csv file
df.to_csv("mycsv.csv")

推荐阅读