python - 在表格 hockey-reference.com 中选择特定列
问题描述
初学者在这里。我能够从 hockey-reference.com 中提取此表
这是关于守门员统计的。我使用此代码来执行此操作:
import requests
import pandas as pd
url = 'https://www.hockey-reference.com/leagues/NHL_2020_goalies.html'
html = requests.get(url).content
df_list = pd.read_html(html)
df = df_list[0]
print(df)
从该表中,我只需要四列,它们是:
- Rk
- 播放器
- SV%
- 质量百分比
所以我想我想做的是基本上“识别”我需要的 4 列,但我尝试的一切都失败了。
我确信这并不复杂,但我就是想不通。
解决方案
推荐阅读
- jupyter-notebook - 如何重新排序 jupyter 笔记本中的单元格?
- android - 在使用 addTextChangeListener 和更新值时遇到问题?
- json - 调用 .NET Web API 时出现 Flurl 反序列化问题
- android - android.os.DeadSystemException 由 GooglePlayServicesUtilLight.getRemoteContext
- python - 如何断言 Pandas 数据框列中的所有值都具有所需的长度
- python - 如何从 csv 文件中删除停用词
- php - 如何在php中以间隔获取两个日期时间戳之间的日期时间范围
- python - 如何通过外键获取数据
- javascript - 返回带有对象的函数时的 React tree-shaking 问题 [Typescript + React + Rollup]
- javascript - TypeError:无法读取未定义的属性“加载”