python-3.x - 从 Pandas 数据框列中剥离字符
问题描述
我试图只获取团队名称并删除在我抓取表格时附加的团队记录。我知道我可以使用 rstrip(),但我不想输入所有要删除的团队记录。有任何想法吗?
# Using Pandas to extract rankings tables
import pandas as pd
tables = pd.read_html(base_site)
# base_site = "http://cbssports.com/college-football/rankings/cbs-sports-ranking/"
rankings=tables[0]
rankings
rankings.drop(['Trend', 'Next Game', 'Unnamed: 5', 'Unnamed: 3'], axis=1)
从中我得到:
Rank Team
0 1 LSU 15-0
1 2 Clemson 14-1
2 3 Ohio St. 13-1
3 4 Georgia 12-2
4 5 Oregon 12-2
... ... ...
125 126 New Mexico St. 2-10
126 127 Old Dominion 1-11
127 128 UTEP 1-11
128 129 Massachusetts 1-11
129 130 Akron 0-12
130行×2列
希望从团队列中删除团队的记录。想法?
解决方案
你可以做rsplit
df['Team']=df['Team'].str.rsplit(' ', n=1).str[0]
推荐阅读
- android - Jetpack 使用 Fragments 编写 NavHost
- drools - 无法将具有多个流规则的 KieSession 序列化为字节 []
- reactjs - 在 Emotion 中使用 ClassName 覆盖类
- python - 为什么 super().__init__() 不起作用?面向对象
- javascript - 从画布图像中删除背景
- python - Python Pandas:如何在两个固定日期之间以分钟级别创建随机时间戳
- python - 使用 PyPdf2 替换 pdf 中的文本
- linux - Ansible 变量为空
- c# - 是否可以在 C# 中具有与另一个接口的字段的接口,但在实现中使用实现接口的类?
- openlayers - Openlayers:修改圆但不允许更改中心