python - 使用python截断Databricks中的增量表
问题描述
这里给出了针对 Python 和 SQL 的Delta 表删除操作。此处给出了使用 SQL 进行截断。但找不到 Python 截断表的文档。如何为 Databricks 中的增量表执行此操作?
解决方案
并非所有内容都作为 Python 或 Java/Scala 的函数公开。有些操作是仅限 SQL 的,OPTIMIZE
例如。如果要截断表,有两种选择:
- 采用
spark.sql("TRUNCATE TABLE <name>")
或者
spark.sql("TRUNCATE TABLE delta.`<path>`")
- 在覆盖模式下使用读取 + 写入空数据帧模拟截断:
df = spark.read.format("delta").load("<path>")
df.limit(0).write.mode("overwrite").format("delta").save("<path>")
推荐阅读
- python - PyCharm中的插件plantUML找不到Graphviz
- javascript - 为什么我在 Chrome 中打印页面时会调用 window.matchMedia?
- elasticsearch - minikube's got loads of space, but the pod says no space left on device
- wordpress - 通过其名称/ url 即时获取附件?
- python-3.x - 从相同颜色的背景中分离出前景对象
- clojure - 如何用 babashka 过滤尾部的输出
- django - 字段 'card_exp_month' 需要一个数字,但得到 (4,) - 添加到模型时的 Django 和条带 API
- node.js - MERN mongoDB 集合未更新且未发送响应
- android - 添加一个新的 CheckBox 和一个 editText 视图,当用户在 android 的键盘上点击 Done 时?
- jquery - 我的 AJAX 调用工作正常,但成功功能不起作用