首页 > 解决方案 > 将一列字符串转换为熊猫列表

问题描述

我对 pandas 数据框中的一列的类型有疑问。基本上,该列作为字符串保存在 csv 文件中,我想将其用作元组以便能够将其转换为数字列表。下面是一个非常简单的csv:

ID,LABELS
1,"(1.0,2.0,2.0,3.0,3.0,1.0,4.0)"
2,"(1.0,2.0,2.0,3.0,3.0,1.0,4.0)"

如果使用函数“read_csv”加载它,我会得到一个字符串列表。我试图转换为列表,但我得到了字符串的列表版本:

df.LABELS.apply(lambda x: list(x))

返回:

['(','1','.','0',.,.,.,.,.,'4','.','0',')']

关于如何做到这一点的任何想法?

谢谢你。

标签: pythonstringlistpandastuples

解决方案


使用str.stripstr.split

df['LABELS'] = df['LABELS'].str.strip('()').str.split(',')

但是,如果NaN这里没有,也可以list comprehension很好地工作:

df['LABELS'] = [x.strip('()').split(',') for x in df['LABELS']]

推荐阅读