snowflake-cloud-data-platform - 如何一次将 S3 存储桶上多个 CSV 文件中的几列插入雪花表(在单个查询中)
问题描述
我想将位于 S3 位置的多个 CSV 文件中的特定列插入到雪花表中。假设第一个 CSV 文件的第 1 列到雪花表的第 1 列,第 2 个 csv 文件的第 5 列到雪花表的第 2 列......等等......所以可以为此创建查询吗?
解决方案
您需要提供更多信息 =)
一般来说,您将如何链接/关联两个 CSV 文件的信息?您至少需要一个可从这两个来源获得的某种密钥。
我会在步骤和 ELT 思维方式而不是 ETL 中考虑它:
- 将 CSV1 加载到 Table1
- 将 CSV2 加载到 Table2 中
- CREATE 或 REPLACE Table3(CommonKey 数据类型、Column1 数据类型、Column2 数据类型)
- INSERT INTO Table3 SELECT T1.CommonKey, Column1, Column2 FROM Table1 T1 JOIN Table2 T2 ON T1.CommonKey = T2.CommonKey
推荐阅读
- javascript - Discord.js v12 如何将新创建的角色分配给用户?
- dart - 引用字符串的列表
- sql-server - SQL Server 删除子字符串,直到逗号或右括号
- tomcat - RESTeasy ContainerRequestFilter 部署到tomcat时不包含用户信息(容器管理身份验证)
- flutter - Flutter:我想访问 setstate 的更改值,当我访问它时它没有显示新的状态值
- android - Android - 通过 Intent 启动另一个应用程序时保持演示文稿显示
- python - 输出: [
] - python - 重命名我的 pandas DataFrames 中的前 10 列
- sql - SQL Server 存储过程返回超过 50 行超时,但不是一直
- excel - 无法将formua注入excel单元格