python - 'DataFrameGroupBy' 对象的 pandas 'to_csv' 问题)
问题描述
我想将 Pandas groupby 数据框输出到 CSV。尝试了各种 StackOverflow 解决方案,但没有奏效。
蟒蛇 3.7
这是我的代码
groups = clustering_df.groupby(clustering_df['Family Number'])
groups.apply(lambda clustering_df: clustering_df.sort_values(by=['Family Number']))
groups.to_csv('grouped.csv')
错误信息
(AttributeError:无法访问“DataFrameGroupBy”对象的可调用属性“to_csv”,请尝试使用“应用”方法)
解决方案
你只需要这样做:
groups = clustering_df.groupby(clustering_df['Family Number'])
groups = groups.apply(lambda clustering_df: clustering_df.sort_values(by=['Family Number']))
groups.to_csv('grouped.csv')
您所做的是,没有保存 groupby-apply 变量。它会被应用并可能会根据您使用的 IDE/Notebook 抛出输出。但是要将其保存到文件中,您必须在 groupby 对象上应用该函数,将其保存到变量中,然后才能保存文件。
链接也有效:
groups = clustering_df.groupby(clustering_df['Family Number']).apply(lambda clustering_df: clustering_df.sort_values(by=['Family Number']))
groups.to_csv("grouped.csv")
推荐阅读
- javascript - 简单的 JavaScript 语句不适用于侧导航栏
- python - 如何检查特定数据类型的数据框中的缺失值?
- python - 在图像上拟合 2D_gaussian 以在 Python 中提取协方差矩阵
- sql - 如何在 SQL 的同一查询中引用先前计算的输出?
- c++ - 逻辑门的快速计算
- javascript - Javascripts 集合:Set.prototype.values() 和 Set.prototype[@@iterator]() 有什么区别?
- amazon-web-services - 为什么 traceroute 使用 VPC 忽略 AWS EC2 中的路由表
- html - 如何检测是否在 HTML 页面上的任意位置按下了某个键?
- c++ - 写入未初始化的变量:未定义的行为?
- sql-server - Microsoft SQL Server Management Studio - 添加新链接服务器时无法选择“其他数据源”