pandas - 如何使用熊猫中的公共列查找多列的平均值
问题描述
如何使用“count”列计算所有列的平均值。我在下面的代码中创建了一个带有随机生成值的数据框。
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10,10)*100/10).astype(int)
df
output:
A B C D E F G H I J
0 4 3 2 8 5 0 9 9 0 5
1 1 5 8 0 5 9 8 3 9 1
2 9 5 1 1 3 2 6 3 8 3
3 4 0 8 1 7 3 4 2 8 8
4 9 4 8 2 7 9 7 8 9 7
5 1 0 7 3 8 6 1 7 2 0
6 3 6 8 9 6 6 5 0 8 4
7 8 9 9 5 3 9 0 7 5 5
8 5 5 8 7 8 4 3 0 9 9
9 2 4 2 3 0 5 2 0 3 0
我找到了像这样的单列的平均值。如何找到关于熊猫计数的多列的平均值。
df['count'] = 1
print(df)
df.groupby('count').agg({'A':'mean'})
A B C D E F G H I J count
0 4 3 2 8 5 0 9 9 0 5 1
1 1 5 8 0 5 9 8 3 9 1 1
2 9 5 1 1 3 2 6 3 8 3 1
3 4 0 8 1 7 3 4 2 8 8 1
4 9 4 8 2 7 9 7 8 9 7 1
5 1 0 7 3 8 6 1 7 2 0 1
6 3 6 8 9 6 6 5 0 8 4 1
7 8 9 9 5 3 9 0 7 5 5 1
8 5 5 8 7 8 4 3 0 9 9 1
9 2 4 2 3 0 5 2 0 3 0 1
A
count
1 4.6
解决方案
如果需要mean
按列使用每组的所有列count
:
df.groupby('count').mean()
如果mean
所有行都需要(例如,如果 中的值相同,则进行分组count
)使用:
df.mean().to_frame().T
推荐阅读
- opencv - 解码MB时ffmpeg RTSP错误
- ruby-on-rails - 阻止视图访问模型
- java - 在 Cucumber 中的 Scenario Outline 钩子之后
- google-app-engine - 403 Insufficient OAuth2 scope to perform this operation
- python - 从两个数组的列表中选择元素
- powershell - 在 -XX:OnOutOfMemoryError 事件期间执行批处理脚本的问题
- c# - 无法从 Web 服务访问公共课程
- php - Laravel:有什么方法可以在不编译的情况下加载刀片模板?
- reactjs - React - Redux:测试在其他操作中分派的操作
- vue.js - 防止 url 出现或修改当前地址栏值