apache-spark-sql - 使用 spark.sql() 在 Azure Databricks 笔记本中生成不稳定的数据
问题描述
我正在用 azure databricks 创建一个笔记本,在这里我发现了一种不自然且不稳定的数据行为,该行为是从 spark.sql() 执行的查询返回的
例如,我有一个带有单整数(非空)列的 DataFrame。因此,我还使用createOrReplaceTempView()从同一个 DataFrame 创建了一个临时视图
现在,当我使用 spark.sql 查询where条件时,它返回了一个整数的数据,而不是另一个整数的数据。作为 Cmd 15,除了第 5 行查询之外,其他所有查询都给了我正确的结果。
不太可能,下面是第 5 行的结果
解决方案
推荐阅读
- python - 如何制作 DataFrame,哪些名称取自名称列表?
- javascript - 在 react js 中运行代码但没有得到预期输出时没有异常
- javascript - 如何让 useEffect() 像 componentDidMount() 一样工作?
- three.js - pythreejs:如何将剪裁的表面渲染为实体对象
- android - 启动 Android AVD 时无法获取属性集
- symfony - API 平台模型属性是只读的
- maven - 同一个应用程序中的两个版本的spring
- javascript - Trampoline 递归导致“超出最大调用堆栈大小”
- angular - 具有引导响应式设计的角度虚拟滚动
- python - 为什么索引这个 Numpy 矩阵会导致错误?