首页 > 解决方案 > 在 HIVE HDFS 中的所有节点上传播数据

问题描述

我正在尝试一个用例,当我在 Hive 中创建一个表并将数据加载/插入到表中时,它只将数据存储在 Namenode 根据 HDFS 文件系统管理的任何底层 Datanode 中。

在我的用例中,当我们将数据加载到 Hive 表中时,我必须自动将数据分布在集群中的所有现有 DataNode 中。假设如果有 3 个节点,表数据应该分布在这些节点上。我在这里没有计算复制,而是实际数据应该分布在所有现有节点上。

有没有什么简单的方法可以通过任何设置在 Hive 中实现?

标签: hadoophive

解决方案


推荐阅读