python - 如何使用 pandas 数据框对数据进行反规范化
问题描述
我有一个用 CSV 文件创建的熊猫数据框。数据框看起来像这样
srvr_name log_type hour
server1 impressionWin 18:00:00
server1 transactionWin 18:00:00
server2 impressionWin 18:00:00
server2 transactionWin 18:00:00
我想从中得到的是:
srvr_name impressionWin transactionWin hour
server1 true true 18:00:00
server2 true true 18:00:00
在熊猫中实现这一目标的最佳方法是什么?
解决方案
与join
_get_dummies
df.join(pd.get_dummies(df.log_type)).groupby(['srvr_name', 'hour']).sum().astype(bool)
impressionWin transactionWin
srvr_name hour
server1 18:00:00 True True
server2 18:00:00 True True
推荐阅读
- java - 单元测试 Spring-WS SOAP 端点在 MockFilterChain 返回 404 中失败
- python - 如何检查长浮动的长度?Python正在截断长度
- c++ - 替换密码:哪一个?
- docker - gRPC 服务器响应 OS 错误,grpc_status: 14
- javascript - preventDefault() 不适用于特定选项选择
- c# - 在c#中的单独线程中处理队列
- sparql - 自 2019 年 8 月 1 日以来来自 wikidata 的所有足球运动员名单
- css - 使用 CSS 格式化有序列表
- oracle - Oracle 外部表 - 未选择行
- forms - Powershell 表单按钮仅适用于最后一个选项卡