首页 > 解决方案 > 如何跟踪 Google Cloud 公共数据集的变化?

问题描述

谷歌云服务在其云存储服务中有大量可用的公共数据集。我想跟踪其中一些公共数据集的更新/添加。即在将新文件添加到公共数据桶时创建某种 webhook。

我阅读了有关google pubsub 通知的内容,即创建 pubsub 主题以在存储桶上推送更改通知的可能性。

但是,我不知道这些主题是否已经存在于我可以订阅的公共数据集中,或者如何基于公共数据集桶创建这样的主题。

有没有办法跟踪公共数据集的变化,可能使用 pubsub?

标签: google-cloud-platformgoogle-cloud-storagegoogle-cloud-pubsubopendata

解决方案


您可以尝试列出对公共数据集中每个单独存储桶执行的更改。例如,数据集Landsat data的存储桶位置为 gs://gcp-public-data-landsat。正如这里官方文档中所阐明的那样,您可以使用命令查看存储桶gsutil notification watchbucket

使用此命令及其参数,您应该能够设置要跟踪更新的存储桶以及发送此数据的位置。gcp-public-data-landsat监视存储桶的更改并向运行在 example.com 的应用程序服务器发送通知的命令示例:

gsutil notification watchbucket https://example.com/notify gs://gcp-public-data-landsat

notification可以在此处找到有关该命令的更多信息。

我建议您尝试使用它,因为它似乎是可用的选项,因为没有任何预设或配置来观看这些数据集。


推荐阅读