google-cloud-platform - Google Cloud Data Catalog 可以用作 Dataproc(Spark/Hive/Presto)和 GCS 文件的元数据存储库吗?
问题描述
我们使用 MySQL (Cloud SQL) 作为 Dataproc 的元数据存储库。这不存储不属于 Hive 外部表的 GCS 文件的任何信息。
谁能建议将所有文件/数据详细信息存储在 Google Cloud 的一个目录中的最佳方法?
解决方案
推荐阅读
- aws-sdk - carrierwave-aws:Rails API 应用程序文件上传失败并出现 NoMethodError - nil:NilClass 的未定义方法“匹配”
- azure - Azure 内部负载均衡器与 Azure Kubernetes 服务不工作
- javascript - mongo db JS .map 尽管在本地主机中工作,但它在 GAE 中不起作用?或者是其他东西
- protocol-buffers - 通过 php sdk 创建会话上下文时出错
- node.js - 从 .json 文件创建 .env 文件
- python - 如何使用硒驱动程序python单击覆盖中的第一个链接
- ajax - 可以在ajax请求的响应中获取django设置的cookies
- reactjs - React:使变量在函数外重用
- ruby - Rails 无法在类初始化方法中生成实例变量以生成 httparty 请求
- python - np.save 生成的文件中的字节偏移量是否始终为 128?