apache-spark - 为什么删除或选择列在 Spark Structured Streaming 中无法正常工作?
问题描述
我有以下代码和结果。在这里,我正在使用 Databricks 的自动加载器。
我得到的结果不正确,因为如果我不删除列(df2),我会得到以下结果。
请注意,我注意到与select
. 我在这里犯了什么错误?
解决方案
我发现了问题。我需要明确指定第一行是标题。所以,我把相关行改成了这个,
df = (spark.readStream.format("cloudFiles").option("cloudFiles.format", "csv")
.option("header", "true").schema(schema).load("/FileStore/tables/movies7"))
推荐阅读
- arrays - 如何使用结构搜索点之间的最短距离?
- php - 警告:在第126行的C:\xampp\htdocs\bab2\index.php中遇到非数字值
- php - PHP:致命错误:未捕获的 PDOException:SQLSTATE [HY000]
- node.js - 如何使用 NodeJs 检测连接到我的计算机的 4G 加密狗
- python - 扩展python函数以返回更多值
- r - 将 R 中的符号绘制为权重饼图
- javascript - 赛普拉斯“拒绝框架”问题
- javascript - 为什么在使用 mock-fs 时动态导入会在测试之间意外耦合?
- typescript - 获取动态类扩展的自动完成功能
- sqitch - 有没有办法删除添加到 sqitch 的迁移?