hadoop - 为什么 sqoop 增量作业没有在 Metastore 中保存上次更新的值?
问题描述
我正在使用 sqoop 将数据从 Oracle 导入 HDFS。
我每天导入大约 30 个表(增量)。
今天我刚刚发现我的 sqoop 工作没有在 Metastore 中保存上次更新的值。每天使用保存列值进行增量导入。
以下是前两天的日志:-
2019 年 5 月 5 日-
19/05/05 01:37:10 INFO tool.ImportTool: Lower bound value:
TO_TIMESTAMP('2019-04-26 21:25:19.0', 'YYYY-MM-DD HH24:MI:SS.FF')
19/05/05 01:37:10 INFO tool.ImportTool: Upper bound value:
TO_TIMESTAMP('2019-05-04 21:25:25.0', 'YYYY-MM-DD HH24:MI:SS.FF')
2019 年 5 月 6 日-
19/05/06 01:37:34 INFO tool.ImportTool: Lower bound value:
TO_TIMESTAMP('2019-04-26 21:25:19.0', 'YYYY-MM-DD HH24:MI:SS.FF')
19/05/06 01:37:34 INFO tool.ImportTool: Upper bound value:
TO_TIMESTAMP('2019-05-05 21:25:23.0', 'YYYY-MM-DD HH24:MI:SS.FF')
在这里,您可以看到它使用 2019-04-26 21:25:19.0 上次更新的值。它会使我目的地的数据重复。
那么我应该怎么做才能解决这个问题呢?
对此的任何帮助将不胜感激。
谢谢
解决方案
推荐阅读
- python - NameError:名称'urllib'未定义
- csv - 从 CSV 文件导入关系
- javafx - 在JavaFX中更新两个文本对象,一个接着一个字段,只看到两个更改的最终结果
- kubernetes-helm - 如何使用内部服务 pod 之间的权重来路由流量以进行金丝雀发布?
- c# - Forms..NET 3.5 的 ShowDialog 和 Dispose 问题
- python - 试图用前一行计算行的值
- jenkins - 如何更改 Jenkins 保留的构建数量?
- android - 前台服务在android oreo中不起作用
- quartz-scheduler - Quartz调度程序在iis中一段时间后停止工作
- perl - Perl:打印标准输入中数字最大的行