azure-databricks - 是否可以在数据块增量表的同一列中存储 2 种不同的结构类型?
问题描述
我正在接收需要加载到一个表中的多个 XML 文件。这些 XML 文件对于特定列具有不同的结构类型。我想知道这个列是否可以以某种方式存储在数据块表的同一列中。请参阅下面我为同一列 col1 获得的不同结构类型。在 file1 col1 是 struct 和 col1a 是 struct 和 col1a1,col1a2..是 file2 的字符串类型 col1 是一个结构类型,但底层 col1b 和 col1c 是字符串类型。
文件 1 : col1 col1a col1a1 col1a2 。. col1b
文件 2: col1 col1b col1c
解决方案
分别读取两个 xml,然后根据您对各个数据帧的选择将 2 col 的数据类型转换为字符串或结构。最后对两个数据帧进行联合。
推荐阅读
- python - Python - 将默认字符串分配给 1 和 0
- amazon-s3 - create-react-app:从 CDN 提供 index.html 并在新版本发布后加载正确的静态资产
- pandas - 根据 pandas 中的给定条件随机对数据进行子集化
- java - 如何使用Java代码使用一个对象将三个字段存储在ArrayList中?
- sql - 如何在 SQL 查询更新中传递变量
- mysql - 如何从 Visual Studio Code 连接到 MySQL 服务器
- c# - 从 WSDL 更改生成的服务引用调用的 HTTP 主机头
- sql - 过滤子查询性能问题
- node.js - 如果节点关闭,如何在多个节点上处理 socketio
- sql - 地理坐标在原始 GPS 表中时如何获取出行方式