hive - Parquet 是否有与 SymlinkTextInputFormat 等价的东西?
问题描述
我有时SymlinkTextInputFormat
与 Athena 一起使用以避免移动文件。文档SymlinkTextInputFormat
声明“目标输入数据应该在TextInputFormat
”,听起来应该排除 Parquet、ORC 和其他非文本数据格式。
即便如此,SymlinkTextInputFormat
与 Parquet 或 ORC serdes 一起使用似乎也有效。例如,S3 Inventory文档将它与 Parquet 和 ORC 一起使用,在我的测试中它似乎工作正常。
SymlinkTextInputFormat
使用非文本数据格式有什么缺点吗?如果有,是否有任何替代输入格式可以更好地处理这些数据格式,同时仍提供符号链接功能?
解决方案
推荐阅读
- excel - 带有指向另一个工作簿的链接的单元格值未更新
- mysql - Redshift / MySQL - 检查 2 个整数列之间的不相等性返回错误的结果
- angular - ngrx 测试方法调度动作
- java - 关于Gson和Java模型类的问题
- linux - Linux - 如何在不登录的情况下启动守护进程
- base64 - 使用 base64 图像清理 Html(并将其转换为图像)
- angular - 我可以强制 Angular 组件的所有实例都具有属性吗?
- bugzilla - 如何从 Bugzilla 发送测试电子邮件?
- c++ - 如何将自己与损坏的 API 和库调用隔离开来
- mysql - 事件动态值传递