首页 > 解决方案 > 熊猫数据框的 groupby 给出了错误的结果

问题描述

我正在尝试复制一篇论文,其代码是用 Stata 编写的,用于我使用 Python 的课程项目。我很难在他们的 do-file 中复制折叠命令的结果。do-file中对应的行是

collapse lexptot, by(clwpop right)

虽然我有

df.groupby(['cwpop', 'right'])['lexptot'].agg(['mean'])

该变量是我之前使用lexptot的变量 ' ' 的对数。exptotnp.log(dfs['exptot])

有谁知道这里出了什么问题?我计算的平均值通常比在 Stata 中计算的平均值高 1.5 左右。

标签: pythonpandaspandas-groupbystatalogarithm

解决方案


一旦您用更多相关细节更新问题,也许我可以回答更多。但这就是我认为可能对您有所帮助的方法!

df.groupby(['cwpop', 'right']).mean()['lexptot']

推荐阅读