google-cloud-platform - 我们如何与 Dataproc Metastore 交互以获取数据库和表的列表?
问题描述
我将 Dataproc Metastore 用作 GCP 的 Metastore 服务。我如何与之交互以从中获取数据库和表的列表?是否可以在不运行 dataproc cluster的情况下执行此操作?
编辑 - 我必须在不运行 Dataproc 集群的情况下获取元数据。由于我使用 Dataproc Metastore 服务来存储元数据,因此我需要直接从中获取元数据。
解决方案
Dataproc Metastore API用于管理 Dataproc Metastore 服务实例(获取/创建/更新等)。如评论之一所述,您可以使用 thrift URI(如果您使用控制台,您将在 metastore 服务的配置选项卡下找到 URI)。
一旦你有一个连接到 thrift URI 的 thrift 客户端,你就可以获取databases或tables。虽然您也可以使用 thrift API创建数据库和表,但典型的用例是配置像 spark 或 hive 这样的大数据处理引擎/框架以使用元存储而不直接与元存储交互。
推荐阅读
- java - 自定义 TabLayout 指示器 - Android
- javascript - jQuery - Data() 属性返回未定义
- javascript - 在控制台日志输出中转义单引号
- xml - 将 rpc 转换为 Document - 没有类型被映射到具有命名空间的名称
- linux - 如何在 linux 内核模块中使用线程本地存储?
- php - Laravel 自定义 LoginController 不会持久化会话
- python - 使用 Beautiful soup 从 LinkedIn 个人资料中抓取数据时的非类型对象问题
- python - 运行 cv.2 SelectROI 后 cv2.imshow 将不起作用
- amazon-web-services - AWS EC2 实例快速计算 1 TB 文件的 MD5SUM
- r - 如何安排这个图例的位置