首页 > 解决方案 > 在表格 hockey-reference.com 中选择特定列

问题描述

初学者在这里。我能够从 hockey-reference.com 中提取此表

这是关于守门员统计的。我使用此代码来执行此操作:

import requests
import pandas as pd

url = 'https://www.hockey-reference.com/leagues/NHL_2020_goalies.html'
html = requests.get(url).content
df_list = pd.read_html(html)
df = df_list[0]
print(df)

从该表中,我只需要四列,它们是:

  1. Rk
  2. 播放器
  3. SV%
  4. 质量百分比

所以我想我想做的是基本上“识别”我需要的 4 列,但我尝试的一切都失败了。

我确信这并不复杂,但我就是想不通。

标签: pythonpandas

解决方案


推荐阅读