首页 > 解决方案 > 如何将拆分字符串应用于熊猫中的整个excel数据集

问题描述

我有一个庞大的数据集,我想应用它

getNumber = df['Permissions','Per'].str.split('-').str[1]`

在整个数据集上,而不仅仅是在“权限”列上,有什么方法可以将它应用到整个数据集上,而不是在每一列上都指定它。我被困在如何将此操作应用于整个数据集,并希望有任何帮助

回应蒂姆的评论

我的数据集是这样的,

excel表格中的数据集: -

在此处输入图像描述

我想提取每列中的数字,以便新数据集只有数字。

标签: pythonpandas

解决方案


您可以使用pandas.DataFrame.apply

#setup
df = pd.DataFrame({'col1': ['aaa-0.1', 'bbb-1.2'], 'col2': ['zzzz-0.8', 'abc-9.1']})

#      col1      col2
#0  aaa-0.1  zzzz-0.8
#1  bbb-1.2   abc-9.1

df.apply(lambda x: x.str.split('-').str[1])

#  col1 col2
#0  0.1  0.8
#1  1.2  9.1


正如@jezrael在评论中所说,您也可以转换为浮动。只需添加.astype(float)

df.apply(lambda x: x.str.split('-').str[1]).astype(float)

推荐阅读