首页 > 解决方案 > 我无法使用 Gzip COMPRESSION 查询数据

问题描述

在 Synapse Analytic Tool 中,我可以通过查询查询 json 文件, 例如https://textuploader.com/t5mgj

SELECT TOP 100 jsonContent FROM OPENROWSET( BULK 'myBlob.net/file.txt', FORMAT = 'CSV', FIELDQUOTE = '0x0b', FIELDTERMINATOR ='0x0b', ROWTERMINATOR = '0x0b' ) WITH ( jsonContent varchar(MAX) ) AS [result]

但是当涉及到像https://www.file.io/download/wy5xQYiuXcEc这样的 gzip 文件 (我在 blob 中的真实数据是 gz )时,我不能使用下面的代码来查询它

SELECT TOP 100 jsonContent FROM OPENROWSET( BULK 'myBlob.net/file.gz', FORMAT = 'CSV', FIELDQUOTE = '0x0b', FIELDTERMINATOR ='0x0b', ROWTERMINATOR = '0x0b', DATA_COMPRESSION = 'Gzip' ) WITH ( jsonContent varchar(MAX) ) AS [result]

我做错了什么我也无法使用此 gz 文件创建外部表,甚至无法使用查询创建文件格式

创建外部文件格式 Json_gztry WITH (FORMAT_TYPE = JSON,

DATA_COMPRESSION = 'org.apache.hadoop.io.compress.GzipCodec'  

)

不知道接下来我应该尝试什么

标签: azure-synapse

解决方案


推荐阅读