首页 > 解决方案 > Hive - 外部表和 csv 数据

问题描述

我需要您的一些帮助来解决从 hive 中理解引用数据的问题。以下情况:我有一个CSV fil data.csv 导入hadoop。现在我发现了许多使用外部表在 csv 文件之上创建模式的片段。我的问题是,hive 是如何知道外部表的架构连接到 data.csv 的。在示例中,我找不到对 csv 文件的引用。

这个 hive 示例中引用了 sample_1.csv 以供使用,或者 hive 如何知道来自 sample_1.csv 的数据包含数据?

标签: csvimporthive

解决方案


在创建外部表时,我们必须提供列列表和 hdfs 位置。Hive 将仅存储列元数据,如列名、数据类型……和 hdfs 位置。

当我们对外部表执行查询时,它将获取元数据,然后从 hdfs 位置获取可用文件。


推荐阅读