google-cloud-platform - 如何跟踪 Google Cloud 公共数据集的变化?
问题描述
谷歌云服务在其云存储服务中有大量可用的公共数据集。我想跟踪其中一些公共数据集的更新/添加。即在将新文件添加到公共数据桶时创建某种 webhook。
我阅读了有关google pubsub 通知的内容,即创建 pubsub 主题以在存储桶上推送更改通知的可能性。
但是,我不知道这些主题是否已经存在于我可以订阅的公共数据集中,或者如何基于公共数据集桶创建这样的主题。
有没有办法跟踪公共数据集的变化,可能使用 pubsub?
解决方案
您可以尝试列出对公共数据集中每个单独存储桶执行的更改。例如,数据集Landsat data
的存储桶位置为 gs://gcp-public-data-landsat
。正如这里官方文档中所阐明的那样,您可以使用命令查看存储桶gsutil notification watchbucket
。
使用此命令及其参数,您应该能够设置要跟踪更新的存储桶以及发送此数据的位置。gcp-public-data-landsat
监视存储桶的更改并向运行在 example.com 的应用程序服务器发送通知的命令示例:
gsutil notification watchbucket https://example.com/notify gs://gcp-public-data-landsat
notification
可以在此处找到有关该命令的更多信息。
我建议您尝试使用它,因为它似乎是可用的选项,因为没有任何预设或配置来观看这些数据集。
推荐阅读
- kubernetes - 为什么 kubernetes pods 错误提示在修复问题后不刷新
- python-2.7 - 如何切换到 TCP 版本?
- python - 如何在 python 中使用用户输入和 1 到 100 之间的值和没有重复值的值对列表进行排序?
- python - 异常类型错误:'参数列表必须是元组'
- html - 每个文本框都应位于面板中的新行中
- python - 从索引列表中检索数组元素
- github - 使用 Azure DevOps,从 GitHub 获取提交列表,以便作为发布的一部分传递给 Sentry?
- c++ - YouCompleteMe conf 文件,用于检查库头文件而不报告库错误
- r - 使用编码在 R 中调度脚本
- javascript - 用锚标记替换字符串的多个部分