apache-spark - Spark 多目录支持
问题描述
我正在尝试在 spark 3.x 中添加多个 spark 目录,但我有一个问题: spark 是否支持允许我们使用由命名空间管理的多个目录的功能,如下所示:
spark.sql.catalog.<ns1>.conf1=...
spark.sql.catalog.<ns1>.conf2=...
spark.sql.catalog.<ns2>.conf1=...
spark.sql.catalog.<ns2>.conf2=...
作为上面的配置,我们可以像这样使用 2 个目录:
spark.sql("SELECT * FROM ns1.db1.table1") // Load data from table1 in db1 of catalog ns1
spark.sql("SELECT * FROM ns2.db2.table2") // Load data from table2 in db2 of catalog ns2
谢谢
解决方案
您可以通过添加附加目录
spark.sql.catalog.catalog1=...
spark.sql.catalog.catalog1.type=...
spark.sql.catalog.catalog1.warehouse=...
spark.sql.catalog.catalog2=...
spark.sql.catalog.catalog2.type=...
spark.sql.catalog.catalog2.warehouse=...
catalog1
andcatalog2
本身是目录名称,因此可以像您提到的那样使用它。
spark.sql("SELECT * FROM catalog1.db1.table1")
推荐阅读
- javascript - 使用Javascript通过chrome打开完整文件下载URL时如何指定下载位置
- exception - Unbale 使用委托工具包与加拿大边境服务局(CBSA)建立通信
- python - Python Gekko中目标函数的约束
- python - 如何解决“ValueError:“连接”层需要具有匹配形状的输入,连接轴除外”?
- javascript - Snowflake UDF 和 Javascript - JavaScript 编译错误问题:未捕获的 SyntaxError
- python - 如何使用 Numba 为 Python 中的线程释放 GIL?
- javascript - XO 游戏(我如何证明玩家一(p1)或玩家二(p2)如果满足(var winBoxes)中的条件之一获胜
- bdd - Picocontainer 未与步骤文件共享数据,我的测试被跳过
- ruby-on-rails - Rails:如何找到没有关联记录的相同模型关联记录
- laravel - Vue.js 和 laravel 的 delete 方法问题