首页 > 解决方案 > 根据熊猫列中的值创建一个列表,但有例外

问题描述

我想添加到COL2仅当COL1值唯一时的列表值(只有一个与COL1值匹配)。

List_lonely_sequences=[]

这是数据框

COL1 COL2
SP1  SEQA
SP1  SEQB
SP1  SEQC
SP2  SEQC
SP2  SEQD
SP3  SEQA
SP4  SEQB
SP4  SEQD
SP5  SEQL
SP6  SEQL

我的 list( List_lonely_sequences) 应该包含SEQA,因为它是唯一与SP3. 我的列表也应该包括SEQL,因为它是唯一与SP5and匹配的序列SP6

预期的结果是:

List_lonely_sequences = ['SEQA','SEQL']

标签: pythonpandas

解决方案


这应该有效:

unique_vals = df.drop_duplicates(['COL1'], keep=False)['COL2'].unique()

推荐阅读