首页 > 解决方案 > 从 Pandas 数据框列中剥离字符

问题描述

我试图只获取团队名称并删除在我抓取表格时附加的团队记录。我知道我可以使用 rstrip(),但我不想输入所有要删除的团队记录。有任何想法吗?

# Using Pandas to extract rankings tables

import pandas as pd

tables = pd.read_html(base_site)
# base_site = "http://cbssports.com/college-football/rankings/cbs-sports-ranking/"

rankings=tables[0]
rankings

rankings.drop(['Trend', 'Next Game', 'Unnamed: 5', 'Unnamed: 3'], axis=1)

从中我得到:

    Rank    Team
0   1   LSU 15-0
1   2   Clemson 14-1
2   3   Ohio St. 13-1
3   4   Georgia 12-2
4   5   Oregon 12-2

...     ...     ...
125     126     New Mexico St. 2-10
126     127     Old Dominion 1-11
127     128     UTEP 1-11
128     129     Massachusetts 1-11
129     130     Akron 0-12

130行×2列

希望从团队列中删除团队的记录。想法?

标签: python-3.xpandas

解决方案


你可以做rsplit

df['Team']=df['Team'].str.rsplit(' ', n=1).str[0]

推荐阅读