首页 > 解决方案 > 删除数据框中小数点后的值 - 正则表达式

问题描述

进入后:

df["column name"].unique()

该列具有以下值:

array(['A','B','C','D','D,A,C','B,A'],
dtype=object)

我想删除小数点后的所有值并留下如下内容:

array(['A','B','C','D','D','B'],
dtype=object)

即去掉小数点后的所有值,只留下第一个值。

我尝试:

df["col name"] = df["col name"].astype(str).str.replace(r',\d+$', '')

但这对我不起作用。

标签: pythonregexpandasdataframe

解决方案


您似乎有 CSV字母字符串,而不是数字,但无论如何,如果您只想在第一个逗号之后(包括)删除所有内容,那么也许只需尝试用,.*$空字符串替换:

df["col name"] = df["col name"].astype(str).str.replace(r',.*$', '')

推荐阅读