首页 > 解决方案 > 如何过滤掉包含某些字符串的“set”类型值的pandas df行?

问题描述

我有一些数据框包含一列,其中的值是“set”类型的。

我还有一个单词列表,我希望在这些集合中搜索并删除包含列表命中的行

例如 df 结构

id   types 
123  {'Editorial', "Research Support, Non-U.S. Gov't", 'Comment'}
234  {'Comparative Study', 'Journal Article', "Research Support,'Research Support, N.I.H., Extramural'}

这是我要删除的值列表

list_to_drop=['Editorial','Comment']

在这个例子中,我希望删除第一行

谢谢!

标签: pythonpandasdataframe

解决方案


将以下代码与applyand一起使用difference

df['types'] = df['types'].apply(lambda x: x.difference(list_to_drop))

推荐阅读