python - 如何编写用于迭代 DataFrame 的 for 循环并将其子集化以仅包含在每次迭代中检索到的那些列?
问题描述
目的是在样本 1 为 0 时获得一个子集 DataFrame,例如在每次迭代后具有三列 'id'、'reference'、'sample 1'(对每个样本执行此操作)'id'、'reference'、'sample 1' 当样本 1 为 1 时(对每个样本执行此操作)示例当样本 1 = 0 时,生成的子集 DataFrame 将是
解决方案
尝试:
sample_cols = df.columns[2:]
dfs = []
for col in sample_cols:
print('='*50, col, '='*50)
for condition in [0, 1]:
print('='*20, condition, '='*20)
df_subset = df[df[col]==condition].reset_index(drop=True)
df_subset = df_subset[['id', 'Reference', col]]
print(df_subset)
#df_subset.to_csv(f'./{col}_{condition}.csv', index=False)
dfs.append(df_subset)
df_final = pd.concat(dfs, ignore_index=True)
df_final.to_csv('./file_name.csv', index=False)
推荐阅读
- elasticsearch - ElasticSearch:将新记录插入现有索引
- javascript - 使用 React 钩子每 X 秒显示一个不同的值
- android - Unity Android 动态壁纸中的 WallpaperManager 崩溃
- android - 安卓摇篮 | 如何仅为活动 ABI 构建调试 apk
- amazon-web-services - Cloudformation IF 问题
- kubernetes - Kubernetes:如何在 configMap 中设置布尔类型变量
- python - Pandas - 根据来自另一个表的具有相同密钥的不同电子邮件扩展表
- r - 如何在 R 中使用 left_join 函数避免重复
- java - 从 android studio API 28 连接到解析服务器的 i/o 失败
- javascript - 如何在 Ant Design (Antd)、React js 中获取 Dropdown 组件的值