azure-synapse - 我无法使用 Gzip COMPRESSION 查询数据
问题描述
在 Synapse Analytic Tool 中,我可以通过查询查询 json 文件, 例如https://textuploader.com/t5mgj
SELECT TOP 100 jsonContent FROM OPENROWSET( BULK 'myBlob.net/file.txt', FORMAT = 'CSV', FIELDQUOTE = '0x0b', FIELDTERMINATOR ='0x0b', ROWTERMINATOR = '0x0b' ) WITH ( jsonContent varchar(MAX) ) AS [result]
但是当涉及到像https://www.file.io/download/wy5xQYiuXcEc这样的 gzip 文件 (我在 blob 中的真实数据是 gz )时,我不能使用下面的代码来查询它
SELECT TOP 100 jsonContent FROM OPENROWSET( BULK 'myBlob.net/file.gz', FORMAT = 'CSV', FIELDQUOTE = '0x0b', FIELDTERMINATOR ='0x0b', ROWTERMINATOR = '0x0b', DATA_COMPRESSION = 'Gzip' ) WITH ( jsonContent varchar(MAX) ) AS [result]
我做错了什么我也无法使用此 gz 文件创建外部表,甚至无法使用查询创建文件格式
创建外部文件格式 Json_gztry WITH (FORMAT_TYPE = JSON,
DATA_COMPRESSION = 'org.apache.hadoop.io.compress.GzipCodec'
)
不知道接下来我应该尝试什么
解决方案
推荐阅读
- android - imeOptions="actionSend" 在材料设计中不起作用
- python - 根据重复列中的条件填充缺失值
- vue.js - @babel/plugin-syntax-dynamic-import 在导入的节点模块中不起作用
- python - 在 irecv 中将对象作为缓冲区传递 - TypeError:期望一个可写的缓冲区对象
- ruby-on-rails - 数据库记录更改时片段缓存不更新键
- google-apps-script - 展开提供的代码以覆盖整个表格
- python - 将 Django 应用程序部署到 Elastic Beanstalk 时出现内部服务器错误 500
- python - 在 ner 之前添加 EntityRuler 并将模型保存到磁盘崩溃加载模型
- android - 如何找到在此回收器适配器中单击的项目。我想自己使用这段代码
- python - 为 pygame 混音器设置输出设备