首页 > 解决方案 > 如何使用 pandas 数据框对数据进行反规范化

问题描述

我有一个用 CSV 文件创建的熊猫数据框。数据框看起来像这样

srvr_name log_type       hour  
server1   impressionWin  18:00:00 
server1   transactionWin 18:00:00 
server2   impressionWin  18:00:00 
server2   transactionWin 18:00:00 

我想从中得到的是:

srvr_name impressionWin transactionWin hour
server1   true          true           18:00:00
server2   true          true           18:00:00 

在熊猫中实现这一目标的最佳方法是什么?

标签: pythonpandas

解决方案


join_get_dummies

df.join(pd.get_dummies(df.log_type)).groupby(['srvr_name', 'hour']).sum().astype(bool)

                    impressionWin  transactionWin
srvr_name hour
server1   18:00:00           True            True
server2   18:00:00           True            True

推荐阅读