apache-spark - Apache Spark Column 具有无法使用 PySpark 参与列存储索引的数据类型
问题描述
每当我尝试在 Apache Spark 上使用 PySpark 将数据从 Apache Spark 传输到 Azure SQLDW 时,都会出现以下错误:
Column 'cd_created_date' has a data type that cannot participate in a columnstore index
我的架构如下:
root
|-- extraction_date: string (nullable = true)
|-- ce_case_data_id: string (nullable = true)
|-- cd_created_date: string (nullable = true)
|-- cd_last_modified: string (nullable = true)
|-- cd_jurisdiction: string (nullable = true)
|-- cd_latest_state: string (nullable = true)
|-- cd_reference: string (nullable = true)
|-- cd_security_classification: string (nullable = true)
|-- cd_version: string (nullable = true)
|-- cd_last_state_modified_date: string (nullable = true)
失败从“cd_created_date”字段开始,但我相信我也会收到“cd_last_state_modified_date”的错误。
我的猜测是我需要更改这些字段的架构来解决问题,但我不确定。有什么想法吗?
解决方案
推荐阅读
- bash - 如何使该变量 $f 定义将从第 3 列打印多少“频率”?
- batch-file - 如何循环文本文件的每一行以使用 Windows 批处理文件进行打印?
- groovy - 无法从非 gui 模式运行 Jmeter 测试
- node.js - cloudinary 文件太大
- javascript - 如何将函数从一个文件导出到另一个 node.js?
- python - 错误 django-softdelete:命令出错,退出状态为 1:python setup.py egg_info 检查日志以获取完整的命令输出
- python - 使用python执行Mysql存储过程
- python-3.x - 如何将单线程代码转换为多线程代码
- arrays - SwiftUI中数组的值和标题列表
- javascript - Javascript:如何更改 URL 中的路径名