python - 如何将大量熊猫系列组合成DataFrame?
问题描述
我有 180 000 个熊猫系列,我需要将它们组合成一个 DataFrame。一个一个地添加它们需要花费很多时间,显然是因为当数据帧的大小增加时,附加会变得越来越慢。即使我使用比 Pandas 更快的 numpy,同样的问题仍然存在。
从 Series 创建 DataFrame 的更好方法是什么?
编辑:更多背景信息。系列存储在一个列表中。它是体育数据,该列表名为 player_library,包含 180 000 多个项目。我没有意识到只写就足够了
pd.concat(player_library, axis=1)
而不是列出所有单个项目。现在它工作得又快又好。
解决方案
您可以尝试pd.concat
代替append
.
如果您希望每个系列都成为一列,那么
df = pd.concat([list_of_series_objects], axis=1)
有关为什么迭代和追加成本高昂的更多详细信息,请阅读此问题
推荐阅读
- python - OSX 上的“jupyter”命令来自哪里
- java - 比较 Java Errorr 中的两个字符串小时数
- ruby-on-rails - 如何显示包含项目有 0 个喜欢?
- webview - 如何使用flutter webview获取html元数据
- memory-leaks - 堆摘要中的 Windbg 内存大小与使用统计信息不匹配
- javascript - Javascript 窗口卸载
- node.js - 通过 Bitnami 将部署 Nodejs+MongoDB 应用程序的 EC2 实例传输/复制到另一个 aws 帐户
- nutch - 如何修复 .locked 已存在于 nutch 爬虫中?
- c# - 我如何制作一个计时器并为每一秒增加一个变量
- c# - 简化c#中的嵌套for循环