首页 > 解决方案 > 使用 Python 删除数据框中特定字符之后的所有字符

问题描述

有一个特定字符的列表,我们需要删除它后面的所有字符。

输入数据:

  text_dir
abc School, Uk
xyz College, USA
Pqr University, Berlin

需要的输出值:

  text_dir
abc School
xyz College
Pqr University

代码片段:

spl_character=['School', 'college', 'university']
df['text_dir'] = df['text_dir'].str.split(spl_character).str[0]

Gives Error:
TypeError: unhashable type: 'list'

标签: pythonpandas

解决方案


国际大学联盟:

pat = f'(?i)^(.*)({"|".join(spl_character)}).*$'
df.text_dir.str.replace(pat, r'\1\2', regex=True)

0        abc School
1       xyz College
2    Pqr University
Name: text_dir, dtype: object

推荐阅读