python - DataFrame Pivot Table 在特定列上运行特定功能
问题描述
我有一个包含以下信息的数据集。我想编写一个数据透视表,计算日期列中的天数,然后在印象、点击、转化和预算交付列上运行总和。本质上,我想要表格的摘要
Date Impressions Clicks Conversions Budget Delivered
0 1/1/2019 11,506,995 1,672 88 $12,124.14
1 1/2/2019 9,394,458 1,516 179 $9,838.45
2 1/3/2019 4,696,388 878 129 $6,858.67
3 1/4/2019 8,987,784 1,179 107 $9,566.55
4 1/5/2019 8,923,751 1,171 88 $9,322
我无法弄清楚如何返回这个单行 DataFrame。我正在尝试使用 pivot_table 方法,但 groupby 参数没有返回所需的结果。不知道如何处理这个问题。
解决方案
from datatable import dt, f, by
df = dt.Frame("""
Date Impressions Clicks Conversions Budget Delivered
1/1/2019 11,506,995 1,672 88 $12,124.14
1/2/2019 9,394,458 1,516 179 $9,838.45
1/3/2019 4,696,388 878 129 $6,858.67
1/4/2019 8,987,784 1,179 107 $9,566.55
1/5/2019 8,923,751 1,171 88 $9,322
""")
budget = df['Budget'].to_list()[0]
budget = [float(x.replace('$', '').replace(',', '')) for x in budget]
df['Budget'] = dt.Frame(budget)
df[:, dt.sum(f[1:6])]
| Impressions Clicks Conversions Budget Delivered
-- + ----------- ------ ----------- ------- ---------
0 | 43509376 6416 591 47709.8 0
推荐阅读
- docker - curl: (6) 访问子域时无法解析主机
- javascript - 当浏览器页面加载时,需要一些帮助才能在后台自动播放音乐
- firebase - 如何防止 Firebase 身份验证用户自行更改其电子邮件地址?
- powershell - 在 powershell 中找不到 ExecuteBatch 错误的重载
- powershell - 在 IE 中使用 powershell 打开网页挂起
- schema.org - 常见问题解答的 SDTT 错误:“Google 无法识别 CreativeWork 类型的对象的属性 interactionType。”
- python - Python Selenium,如果登录失败,如何尝试多个值
- sml - 在 ML New Jersey 中创建交集和差异
- mysql - 如何在同一列上创建多个搜索条件
- reactjs - 弹出创建反应应用程序笑话覆盖率报告不准确