首页 > 解决方案 > 在数据块中使用 Pyspark(Python) 连接不起作用

问题描述

使用 Pyspark 的内部连接不适用于使用分区 csv、常规 csv 和 SQL 表创建的数据帧。

例如:当我尝试对使用分区 csv(存储在 ADLS 中)和普通 csv 创建的数据帧应用内连接时,输出 df 使用空白值创建,但是当我加入在常规 csvs 上创建的数据帧时,它工作正常。

数据块对此有任何限制吗?

标签: azuredatabrickspyspark-dataframes

解决方案


对不起大家。才知道 DF 模式存在问题。我们纠正了它并且它起作用了。


推荐阅读