python - 连接数据框字典Python
问题描述
我遍历了一个包含 excel 文件的文件夹,将它们转换为数据帧,然后将这些数据帧放入字典中,其中键是文件名。我想要做的是制作一个文件名无关紧要的大型数据框,因为我需要的数据的列名是唯一的。我想合并“基因”列,因为它们重复,用零填充 NaN 分数,然后删除“比率”列。
import numpy as np
import pandas as pd
import math
import os
folder = r'C:\Users\camer\Desktop\Stack Overflow' # Folder path
files = os.listdir(folder)
dict1 = {}
for file in files:
if file.endswith('.xlsx'):
df1 = pd.read_excel(os.path.join(folder,file))
dict1[file] = df1
# Putting all excel files from file into dataframes, then setting those dataframes as the values in the preallocated dict,
# where the keys are the file names
df1 = pd.concat(dict1, axis=1)
df1
如果我尝试在数据框仍由文件名分隔的情况下对基因列进行分组,我会得到:
df1 = pd.concat(dict1, axis=1)
df1 = df1.groupby(df1.columns, axis=1).sum()
df1
解决方案
我认为这应该适合你:
pd.concat(dict1.values())
推荐阅读
- php - 西伯利亚 CMS 字符串无法解析为 XML 错误
- python - 在 Python 中制作子图时调用其他函数
- angular - Angular Material 6 和 Materialisecss
- c++ - 尝试在 catch 块中使用函数时出现异常未处理错误
- akeneo - 如何为图像属性类型添加 URL?/ Akeneo 2.*
- django - Django:当我所有的模型都有一定的价值时,我怎么能做注释呢?
- php - 从 HTML 内部调用 switch case 函数
- html - 如何在文本顶部设置 ol 列表编号?
- php - 基于关系的 Laravel 中间件
- javascript - 单击父“选择所有复选框”时在子复选框旁边显示图像