python-3.x - 不同子组的熊猫中位数
问题描述
我有一个带有列 ['HSIZE', 'AGE2', 'SEX', 'EDU'] 的 pandas 数据框,除了 HSIZE 所有列都是分类变量(我已经为 30 到 40 岁的人剪掉了 AGE2),HSIZE 是一个数字,表示每个观察的家庭规模。
我想要达到的是每个 EDU 级别中 SEX 的 HSIZE 中值
我试图使用错误的结果是
dt = dl.groupby(["HSIZE", "AGE2", "SEX"])["EDU"]
dt = dt.value_counts()
dt = dt.unstack()
dt = dt.median(level="SEX")
dt
获得 此结果(具有正确的最终形式,但数字错误),它告诉我基于此表的个人数量的中位数,而不是这些个人的实际 HSIZE 的中位数
除了正确的代码之外,我还可以要求对这种情况下所涉及的动态进行简要解释,我是 python 的新手,对 pandas 来说更是如此,而且我不断地撞墙
解决方案
推荐阅读
- android - 如何将主题动态添加到芯片视图android
- json - .net core 3 在 AddJsonOptions 中没有 ReferenceLoopHandling
- java - Gradle 版本不更新 Windows 10
- java - 不同的操作取决于选择的单选按钮
- python - 在python中将大型wav文件转换为文本
- excel - excel工作表中的Visula强制页面下拉
- python - Beautiful Soup 不会在命令行界面中运行
- sql - sql server 中两个日期之间的月份,其中每个日期的开始和结束日期在 sql server 中,结束日期可能为空
- mongodb - 我们如何在一个 docker 项目中从 mongodb 获取数据并插入另一个项目的 mongodb
- r - 即使我的矩阵中没有 NA 值,为什么我会收到错误消息:“non-conformable arguments”?