amazon-athena - 在 aws athena 中将行与日期相乘
问题描述
我是aws athena的新手。
有没有办法从这个输入中获得预期的输出?
输入(csv 文件有以下输入)
DATE (yyyymmdd) | ip | FINISHED ( 1:finished; 0: not finish)
2017-01-01 | 111 | 1
2017-01-01 | 222 | 1
2017-01-02 | 333 | 1
2017-01-03 | 444 | 1
预期输出
DATE (yyyymmdd) | ip | FINISHED ( 1:finished; 0: not finish)
2017-01-01 | 111 | 1
2017-01-01 | 222 | 1
2017-01-01 | 333 | 0
2017-01-01 | 444 | 0
2017-01-02 | 111 | 1
2017-01-02 | 222 | 1
2017-01-02 | 333 | 1
2017-01-02 | 444 | 0
2017-01-03 | 111 | 1
2017-01-03 | 222 | 1
2017-01-03 | 333 | 1
2017-01-03 | 444 | 1
解决方案
这是示例查询如何做到这一点:
select t1."DATE (yyyymmdd)",t2.ip from
(SELECT "DATE (yyyymmdd)" FROM tab1 group by "DATE (yyyymmdd)") t1,
(SELECT ip FROM tab2 group by ip) t2
在此“选择”中使用了笛卡尔连接,因此您不能将其应用于大数据集,因为会出现性能问题。
推荐阅读
- python-3.x - 在硒测试中无法识别单击按钮
- f# - F#- 出现错误 HttpFs.Client : "code":"415","message":"Content type '' not supported"
- python - 在这个 python 脚本中,为什么它不像它想象的那样减去?
- python - 如何使用 spacy 提取包含特定模式的句子?
- selenium - 使用 serenity.properties 中的 appium、selenium 网格执行测试
- c++ - 通过直接函数调用将 std::promise 对象传递给函数
- ontology - 使用 gate.creole.ontology 包在本体中旅行
- keycloak - 谷歌云运行 quarkus Keyloack
- python - 页面上的 Python(Flask)刷新给 OpenCv 相机对象带来了问题
- r - 使用 dplyr 聚合组会议条件中的行