首页 > 解决方案 > 使用列表中的每个值来过滤子集?

问题描述

我有一个大型数据集,需要为其创建几个子集。我想取列表中的每个字符串值来过滤较大数据集上的列并保存为子集。所以对于unique列表中的每个值,我需要过滤full_df并保存为一个子集。

这是否需要某种函数、迭代或循环?感谢所有解决此问题的帮助。

unique = ['aba', 'xyz', 'xgx', 'dssd', 'sdjh']

aba = full_df.loc[(full_df['filter'] == "aba")
xyz = full_df.loc[(full_df['filter'] == "xyz")
xgx = full_df.loc[(full_df['filter'] == "xgx")
dssd = full_df.loc[(full_df['filter'] == "dssd")
sdjh = full_df.loc[(full_df['filter'] == "sdjh")

标签: pythonpandasfunctionloopsiteration

解决方案


尝试这样的事情:

d_df =  {}

unique = ['aba', 'xyz', 'xgx', 'dssd', 'sdjh']

for i in unique:
   d_df[i] = full_df.loc[full_df['filter'] == i]

推荐阅读