sqoop - 在数据处理之间会发生什么 sqoop 失败
问题描述
当 Sqoop 导入作业在将数据导入 RDBMS-HDFS 时失败时会发生什么,反之亦然?
解决方案
Sqoop
可以将数据导出HDFS
到RDBMS
使用并行数据传输任务中。每个任务都会打开一个到数据库的连接,通过事务插入到数据库中,并定期提交。这意味着在整个导出作业完成之前,部分数据将在数据库中可用。
如果导出地图任务在多次重试后仍然失败,则整个作业都会失败。任务失败的原因可能包括网络连接问题、数据库完整性约束、格式错误的记录HDFS
、集群容量问题等。在这种失败情况下,已经提交的数据在数据库中仍然可用。
推荐阅读
- c - 位域的整数类型
- java - 如何在Java中的方法之间传递结果
- spring-boot - 可以将正则表达式与@RabbitListener 队列一起使用吗?
- c# - Blazor 链接错误:值不能为空。(参数“输入”)
- discord - 如何将热键与discord静音热键连接并同时显示图像
- javascript - 如何将功能应用于单个选项卡
- vb.net - VB.NET 计时器在第一次计时后停止工作
- c# - 无法启动多个 Kafka 消费者
- css - 为什么宽度为百分比的 div 在 localhost 和 ElasticBeanstalk 环境中显示为不同的长度?
- c++ - 是否可以创建一个 C++ 库,该库可以部署在使用 Core Location(或等效项)的 iOS/Android/HoloLens 上?