parquet - 从存储在 azure data Lake gen2 中的 parquet 格式文件中读取架构信息
问题描述
我有一个 parquet 格式表存储在 azure data Lake gen2 中,该表直接连接到 azure synapse 中的外部表。我正在尝试用 sql 语言制定一个逻辑,它将读取该 parquet 文件表的模式并将其动态粘贴到外部表列名上。
如果您对此有任何想法/逻辑,请告诉我。
解决方案
使用 Synapse Studio 的 Data Lake 探索功能,您现在可以使用 Synapse SQL 池创建和查询外部表,只需右键单击文件即可。仅 Parquet 文件支持从 ADLS Gen2 存储帐户创建外部表的一键手势。
我使用示例镶木地板文件重现了要求。根据需要,文件存储在与 Synapse Workspace 链接的 Data Lake Lake Gen2 中。
从“数据”面板中,选择要从中创建外部表的文件:
将打开一个对话窗口。选择专用 SQL 池或无服务器 SQL 池,为表命名并选择打开脚本:
SQL 脚本是根据文件推断架构自动生成的。该脚本将从 parquet 文件中读取列名。您可以编辑列名并运行脚本。该脚本将自动运行 Select Top 100 *.:
推荐阅读
- firebase - Firebase 函数未提供函数 URL
- javascript - 最好在 componentDidMount 或 componentWillMount 上执行 API 调用?
- performance - PowerShell5。使用行号字符串修改 ascii 文本文件字符串。交换机和 .NET 框架或 cmdlet 和管道?哪个更快?
- python-3.x - 为什么我在 codechef 的第 4 行的这个 python 代码中得到 nzec 错误和 EOFerror?
- manifest - PWA 不添加到主页
- azure - Azure 云上的 Terraform - VM 名称和数据磁盘名称未对齐
- ruby - Ruby回文布尔值返回false
- javascript - Javascript警报仅在chrome中阻止音频循环
- javascript - Axios/Vue - 防止 axios.all() 继续执行
- mysql - 我可以就我的个人 MySQL 项目获得一些意见吗?特别是多对多关系