首页 > 解决方案 > Hadoop 表源详细信息

问题描述

我有一个 hadoop 表,我需要找到表的源类型(关系/平面文件/大型机)。我可以访问色调,表格日志。我可以知道如何提取这些细节吗?

标签: hadoophivehiveqlooziehue

解决方案


您无法从配置单元表中找到数据源。Hive/Impala 表仅保存有关数据的信息和元数据。它不包含它的来源。例如,如果您使用Sqoop从大型机系统加载数据,那么您可以将数据加载到 avro、parquet、压缩、分隔等格式的 hadoop 系统中,或者加载到 hive 表中。

如果您真的想了解数据的沿袭,则需要寻找像Cloudera Navigator这样的企业解决方案。对于这个论坛来说,这个话题的讨论太广泛了。

Cloudera Navigator Lineage URL:https ://docs.cloudera.com/documentation/enterprise/5-3-x/topics/cn_iu_lineage.html


推荐阅读