首页 > 解决方案 > 如何在逗号上拆分然后删除python pandas数据框中的逗号

问题描述

我想用逗号分开,然后删除逗号。我从一个从 csv 文件中读取的包含 2 列的数据框开始。

[name] [feature1, feature2, feature3] - 特征都在一个单元格中,每一行可能有不同数量的特征。

我用这段代码从主df创建了一个子df(拉出了我想要的2列):

df_features =df.loc[:,['name','features']]

然后在 features 列上拆分以使用以下代码将它们分开:

df_features_split = df_features.features.str.split(expand=True,)

它将功能拆分为我想要的它们自己的列,但在文本之后留下逗号。我想摆脱它。我试过了:

df_features_split=df_features_split.replace(',', '')

但它不会删除逗号,我认为它可能需要更具体,但我不太确定。任何帮助将不胜感激。

这是我的 df 拆分之前的示例。对不起,我希望格式没问题。df 有 2 行。

1   The Beehive Loop Trail  beach,  dogs-no,    forest, lake,   views,  wild-flowers,   wildlife
2   Cadillac North Ridge Trail  dogs-leash, forest, kids,   partially-paved,    views,  wild-flowers,   wildlife

谢谢!

标签: pythonpandas

解决方案


你真的很接近答案。你错过的是pandas.Series.str.split()pat的论点。

df_features_split = df.features.str.split(pat=',', expand=True)

推荐阅读