csv - Hive - 外部表和 csv 数据
问题描述
我需要您的一些帮助来解决从 hive 中理解引用数据的问题。以下情况:我有一个CSV fil data.csv 导入hadoop。现在我发现了许多使用外部表在 csv 文件之上创建模式的片段。我的问题是,hive 是如何知道外部表的架构连接到 data.csv 的。在示例中,我找不到对 csv 文件的引用。
在这个 hive 示例中引用了 sample_1.csv 以供使用,或者 hive 如何知道来自 sample_1.csv 的数据包含数据?
解决方案
在创建外部表时,我们必须提供列列表和 hdfs 位置。Hive 将仅存储列元数据,如列名、数据类型……和 hdfs 位置。
当我们对外部表执行查询时,它将获取元数据,然后从 hdfs 位置获取可用文件。
推荐阅读
- flutter - 在 WEB 中运行 Flutter:错误:XMLHttpRequest 错误
- python - 没有名为“PIL”的模块。当我尝试安装它给我一个错误
- java - Java:访问一个类中的属性,该类也是同一个类的对象
- firebase - 如何在 Firestore 中使用多条件
- python - 如何创建二进制数字的无限循环?
- mongodb - 7 月份 MongoDB 聚合中的每日活动总和
- python - 如何使用其他两列(熊猫)中的数据替换一列中的字符串
- amazon-web-services - 如何在 AWS 中有效地聚合数十亿条记录中的数据?
- python - 在 Python 中,哪些变量可以从函数的参数中省略?
- google-sheets - 在查询谷歌表格中加入表格