首页 > 解决方案 > 解析熊猫中的一列

问题描述

我正在尝试获取以逗号分隔的列中的信息并选择某些部分。例如,该列如下所示:

(500、411、130、816)

我希望能够在发生的任何情况下提取某些值,例如 500。

我试图通过数据框通过 CSV 传递代码以选择我想要的列,但是当我尝试通过新的数据框并缩小信息时,我仍然得到所有相同的信息。

def parseFaultCodes(self):
        #df = pandas.read_csv('modified_example.csv')
        #faultCodes = df[(df.RDR == 514)]
        #faultCodes.to_csv('selected_codes.csv')

该代码是我尝试过的,但它仍然只返回我之前拥有的所有相同信息,而不是找到任何 514 实例。

标签: pythonpandas

解决方案


这是一种可能的方法,使用泛型Series.apply

df = pd.DataFrame({
    'id':['A1','A2','A3'],
     'A1':['(500, 600, 700)','(510, 610, 710)','(520, 620, 720)']
})

df['A1_0'] = df.A1.apply(lambda x: x.replace('(','').replace(')','').split(',')[0])

结果:

在此处输入图像描述


推荐阅读