hive - 将旧数据保留在分区配置单元表上
问题描述
将历史数据保存到分区表中
团队,
我在这里有一个场景 - 我有 2 个表 - 一个是非分区的,另一个是一个日期字段上的分区表分区。
已将非分区表中的数据加载到分区表中,并且我已将以下参数设置为加载到分区表中。
write.partitionBy(“date”) \
.format(“orc”) \
.mode(“overwrite”) \
.saveAsTable(“schema.table1”)
现在两个表计数匹配,其中有 3 年的数据。正如预期的那样。
现在我只刷新了最近一年的数据并尝试加载分区表,但它只加载了 1 年的数据,因为我需要分区表中的所有 3 年数据。
我在这里缺少什么.. 我只需刷新 1 年的数据并将其加载到分区表并保持构建历史。
请建议。谢谢
write.partitionBy(“date”)
.format(“orc”)
.mode(“overwrite”)
.saveAsTable(“schema.table1”)
需要每天记录最新数据刷新的历史记录。
解决方案
推荐阅读
- xcode - 如何在 Applescript 的 NSScrollView 中显示终端输出?
- html - 使用居中文本沿父级拉伸显示 flex 或表格内部 div
- swift - 隐式转换函数接收元组
- python - 如何将 f1 度量添加到 tensorflow 多类 DNN 分类器
- vba - Saving attachments results in memory errors
- java - How to properly manage what has been read from a .txt
- syntax - Lisp:如何使用递归来定义一个给定非负整数 N 的函数,生成从 1 到包括 N 的所有整数的列表?
- c - 如何使用 iplink 用 C 设置 CAN 设备
- ios - 单击tableView中的文本字段时,ScrollView没有向上移动
- django - 在 Django 中创建更新或创建表单视图