python - 对 pandas 中的 groupby 函数感到好奇,如何为通用数据集编写 groupby?
问题描述
我想为 groupby 编写一个通用函数,假设我有大约 100 列的数据集,例如它有 70 个分类列,30 个数字属性,现在我想编写一个通用 python 函数,它将只获取数据集并将以图表或数据的形式显示适当的 groupby 结果,在我开始之前有什么专家建议吗?
谢谢, 希瓦姆
解决方案
您可以合并标准库中的 random 模块以获取所有数字列的随机样本。
df = pd.DataFrame({
'a': list('abcde'),
'b': ['1','2','3','4','5'],
'c': range(5),
'd': [i*21 for i in range(5)],
'e': [12,32,45,67,54]})
str_cols = df.select_dtypes(exclude='number').columns.tolist()
num_cols = random.sample(df.select_dtypes('number').columns.tolist(), k=2)
dff = df.loc[:, str_cols+num_cols]
print(dff)
a b d c
0 a 1 0 0
1 b 2 21 1
2 c 3 42 2
3 d 4 63 3
4 e 5 84 4
推荐阅读
- python - Django 长轮询请求超时
- windows - Win10文件资源管理器记不住最大化
- linux - Qt使用directfb作为显示后端,directfb使用backvideo作为缓冲模式,但是WaitVSync导致GUI响应很慢
- python - Websocket 使用 Python 将 JSON 数据流式传输到 Excel
- sql - Posgresql 交叉表替代方案
- c# - 如何从十六进制字符串中获取位范围并将其转换为整数?
- javascript - 使用 lodash orderby 对字母数字字段进行排序
- kubernetes - Kubernetes 显示多个请求而不是一个
- javascript - 尝试理解 npm 进行前端开发
- c# - MogoDB 作为 IdentityServer 的存储:invalid_scope