首页 > 解决方案 > Parquet 是否有与 SymlinkTextInputFormat 等价的东西?

问题描述

我有时SymlinkTextInputFormat与 Athena 一起使用以避免移动文件。文档SymlinkTextInputFormat声明“目标输入数据应该在TextInputFormat”,听起来应该排除 Parquet、ORC 和其他非文本数据格式。

即便如此,SymlinkTextInputFormat与 Parquet 或 ORC serdes 一起使用似乎也有效。例如,S3 Inventory文档将它与 Parquet 和 ORC 一起使用,在我的测试中它似乎工作正常。

SymlinkTextInputFormat使用非文本数据格式有什么缺点吗?如果有,是否有任何替代输入格式可以更好地处理这些数据格式,同时仍提供符号链接功能?

标签: hiveparquetamazon-athena

解决方案


推荐阅读