python - 分类变量 pandas
问题描述
我想以虚拟变量为条件比较我的数据集的平均值、标准差等统计数据。我在某处看到了一个命令,但我不记得了(或者谷歌搜索不成功)。我想产生这样的输出:
dummy mean(var1) mean(var2)
0 1.5 3
1 10 10
也许与groupby有关?
这是一个最小的例子:
dict1 = [{'dummy': '0', 'var1': 1, 'var2': 2},
{'dummy': '0', 'var1': 2, 'var2': 4},
{'dummy': '1', 'var1': 5, 'var2': 8},
{'dummy': '1', 'var1': 15, 'var2': 12},]
df = pd.DataFrame(dict1, index=['s1', 's2','s3','s4'])
解决方案
我相信你想要groupby
+describe
ndf = df.groupby('dummy').describe()
然后只需选择您想要的任何信息
ndf.loc[:, ndf.columns.get_level_values(1)=='mean']
var1 var2
mean mean
dummy
0 1.5 3.0
1 10.0 10.0
describe
可能会更强大,因为会预先为您提供许多不同的统计数据。但当然你可以选择你的方法,例如
df.groupby('dummy').mean()
var1 var2
dummy
0 1.5 3.0
1 10.0 10.0
df.groupby('dummy').std()
var1 var2
dummy
0 0.707107 1.414214
1 7.071068 2.828427
推荐阅读
- google-app-maker - 加载时脚本更改未激活 onValueChange
- python - 是否有 tensor.item() 等效于包含 pytorch 中列表的张量?
- r - 这些 ip 地址是否在 iana_assignments 的 ip 范围内?R语言编程
- ios - iOS 13 - 没有实例化 CBCentralManager 的蓝牙无线电的状态
- javascript - Firebase Cloud Functions onCreate对象在创建计数器时未定义
- php - WordPress 自定义元框不保存数据或显示
- koin - 作用域可以使用作用域 ID 作为参数创建对象吗?
- python - 在容器停止之前,“Docker 日志”错误地显示为空
- php - 如果 PHP 文件不存在,则创建它
- sql - 如何将 BigQuery 表转换为行序列列表,其中序列由滑动窗口及时聚合?