amazon-web-services - 如何通过在 tera 数据中使用 nos_write 将表分区为多个文件到 s3 存储?
问题描述
我有一个如下的sql,它可以将数据写入S3 Storage,</p>
但是只写一个文件,文件名不能自己控制。
如何使用 nos_write 命令将表分区到多个文件(如下修改 sql 命令)? https://imgur.com/a/wqJIk1W (这个是我自己上传的)
如何控制文件名?(默认如下:object_33_1_1.parquet)
SELECT ObjectSize, RecordCount
FROM WRITE_NOS_FM (
ON ( SELECT * FROM RiverFlowPerm_csv )
USING
LOCATION('/s3/bigXXXXXX.s3.amazonaws.com/RiverFlowPerm/')
STOREDAS('PARQUET')
COMPRESSION('GZIP')
) AS d ;
上面的问题没问题
2021/5/21
如何使其分区为 多级目录。
例如:/RiverFlowPerm/1/SiteNo/FLOW
怎么做?下面的这个 sql 向我显示一条错误消息: https ://imgur.com/a/4yKRbdK
SELECT ObjectSize, RecordCount
FROM WRITE_NOS_FM (
ON ( SELECT * FROM RiverFlowPerm_csv )
PARTITION BY SiteNo,FLOW ORDER BY SiteNo,FLOW
USING LOCATION('/s3/biXXXXXXXXX.s3.amazonaws.com/RiverFlowPerm/1/')
STOREDAS('PARQUET')
NAMING('DISCRETE')
INCLUDE_ORDERING('TRUE')
MAXOBJECTSIZE('4MB')
COMPRESSION('GZIP') ) AS d ORDER BY AmpId;
我不知道如何根据错误消息修复它。
解决方案
推荐阅读
- ios - 使用 PadOS13 无法从 iPad 上的扩展坞启动应用程序
- python - 将 df.where 应用于 pandas 中的选择性列以删除混合数据类型数据集中的异常值
- c++ - 使用 GCC 插件 api 动态定义虚拟方法
- wpf - 将 SQL 查询转换为 Linq to Entities
- string - Python:附加到字符串 N 次
- javascript - 将 firestore 中的数据显示到 HTML 表中
- python - 在“with”上下文中同时打开两个文件
- javascript - 我如何使用乘法(*),加法(+)除法(/)作为热键(快捷键)
- perl - 如何使用 system() 从 CGI 文件调用异步 Perl 脚本
- android - 多次调用分页库中的回调