hadoop - Hadoop 表源详细信息
问题描述
我有一个 hadoop 表,我需要找到表的源类型(关系/平面文件/大型机)。我可以访问色调,表格日志。我可以知道如何提取这些细节吗?
解决方案
您无法从配置单元表中找到数据源。Hive/Impala 表仅保存有关数据的信息和元数据。它不包含它的来源。例如,如果您使用Sqoop从大型机系统加载数据,那么您可以将数据加载到 avro、parquet、压缩、分隔等格式的 hadoop 系统中,或者加载到 hive 表中。
如果您真的想了解数据的沿袭,则需要寻找像Cloudera Navigator这样的企业解决方案。对于这个论坛来说,这个话题的讨论太广泛了。
Cloudera Navigator Lineage URL:https ://docs.cloudera.com/documentation/enterprise/5-3-x/topics/cn_iu_lineage.html
推荐阅读
- azure-pipelines - 将文件数组传递给 AWSCLI@1 任务的参数
- java - Android Studio - 系统语言改变时用户界面位置改变
- angular - 如何在离子网格上对齐固定离子段
- php - 从moodle unittest创建讨论时,grade_items表categoryid字段不会更新
- c++ - 寻找两个之间的最大数量,选择哪个实现
- kotlin - 协程块中的方法如何在 Kotlin 中工作?
- elasticsearch - Kibana DSL,在字段具有多个值的字段上聚合
- python - 在 python 中处理来自不同文件的变量时遇到问题。UnboundLocalError
- mysql - 如何从 mysql 数据库中删除所有记录?
- angular - 错误类型错误:无法在 xxxxxxx.push../src/app/xxxx-area/xxxx/xxxx.component.ts.xxxx.toggleVideo 处读取未定义 > 的属性“nativeElement”