python - 如何加入大量数据框
问题描述
我有 35 个相同格式的表(股票),其中有 2 列:["Trading_date","volume"]。如何使用 Pandas python 将它们全部加入以具有这种格式的加入表:["Trading_date", "volume_1","volume_2",...,"volume_35"] 并保留所有但删除重复的“Trading_date”。例如:表 1 有 5 行,表 2 有 7 行,两个表在“Trading_date”共享 4 行。两个表的连接将有 8 行,row["volume"] 中的缺失值将分配为 0 或 null (首选 0) 非常感谢您的帮助。
解决方案
import pandas as pd
tables = [...] # your tables...
for i, tab in enumerate(tables):
try: merged = pd.merge(merged, tab, how='left', on ='Trading_date', suffixes=('', '_%s'%(i)))
except: merged = tab
推荐阅读
- php - 使用 utf-8 土耳其字符集字符串的文件夹名称的 PHP 重命名失败
- arrays - 在 AWS Athena 中使用 serde 格式在 json 文件中提取数组和嵌套数组
- python - 如何根据列中包含的值子集对python中的数据框行进行排序
- sql - 过滤 SQL 错误数据
- python - 尽管安装了 PIP,Python Pillow(或 PIL)仍无法正常工作
- authentication - Google Colab - 无法再安装 Google 云端硬盘 - 浏览器弹出窗口(桌面版 Google 云端硬盘)而不是代码输出中的链接以进行授权
- ssl - 无法连接到 LAN 上的安全 GRPC 服务器
- java - java.lang.UnsupportedClassVersionError:在 Gradle 项目中
- amazon-web-services - 带有托管在 Azure 应用服务上的 REST API 的 Azure 静态应用
- javascript - 基于 Promise 的 Angular 路由 - 404 错误