首页 > 解决方案 > databricks 集群中的通用元数据

问题描述

我在 Azure 云平台的 databricks 实例中有 3-4 个集群。我想为所有集群维护一个公共元存储。让我知道是否有人实现了这一点。

标签: apache-sparkdatabricksazure-databricksdatabricks-connect

解决方案


我建议配置一个外部 Hive 元存储。默认情况下,Detabricks 在幕后旋转自己的元存储。但是您可以创建自己的数据库(Azure SQL 也可以,MySQL 或 Postgres 也可以)并在集群启动期间指定它。

以下是详细步骤: https ://docs.microsoft.com/en-us/azure/databricks/data/metastores/external-hive-metastore

需要注意的事项:


推荐阅读