python - bigQuery Google Cloud 如何与其他用户共享数据集?使用蟒蛇
问题描述
我在 Google Cloud 中使用我的 userA 帐户定义了一个 bigQuery 数据集,我希望我的同事 userB(他是同一组的成员)能够看到我定义的数据集。使用 bq 命令行界面,用户 B 可以看到项目,但看不到数据集。如何使用 python 脚本与 userB 共享 userA 创建的数据集?
解决方案
使用 Python 客户端库的示例。改编自此处,但添加了一个get_dataset
调用以获取现有数据集的当前 ACL 策略:
from google.cloud import bigquery
project_id = "PROJECT_ID"
dataset_id = "DATASET_NAME"
group_name= "google-group-name@google.com"
role = "READER"
client = bigquery.Client(project=project_id)
dataset_info = client.get_dataset(client.dataset(dataset_id))
access_entries = dataset_info.access_entries
access_entries.append(
bigquery.AccessEntry(role, "groupByEmail", group_name)
)
dataset_info.access_entries = access_entries
dataset_info = client.update_dataset(
dataset_info, ['access_entries'])
另一种方法是使用 Google Python API 客户端以及get和patch方法。首先,我们检索现有的数据集 ACL,将组添加READER
到响应中并修补数据集元数据:
from oauth2client.client import GoogleCredentials
from googleapiclient import discovery
project_id="PROJECT_ID"
dataset_id="DATASET_NAME"
group_name="google-group-name@google.com"
role="READER"
credentials = GoogleCredentials.get_application_default()
bq = discovery.build("bigquery", "v2", credentials=credentials)
response = bq.datasets().get(projectId=project_id, datasetId=dataset_id).execute()
response['access'].append({u'role': u'{}'.format(role), u'groupByEmail': u'{}'.format(group_name)})
bq.datasets().patch(projectId=project_id, datasetId=dataset_id, body=response).execute()
相应地替换project_id
、dataset_id
和变量。group_name
role
使用的版本:
$ pip freeze | grep -E 'bigquery|api-python'
google-api-python-client==1.7.7
google-cloud-bigquery==1.8.1
推荐阅读
- xml - 在 Oracle 中将 XML 转换为行和列
- c# - 从串行 com 端口读取的增量延迟
- python - 有没有办法配置 pylint(在 vs 代码中)以识别通过通配符导入的方法?
- excel - 有没有办法遍历多个工作簿以将范围复制到一个活动工作簿中?
- python - 用于查找发生百分比变化所需天数的 Python 函数
- r - 如何为动物园对象上的自定义聚合创建索引
- python - Pyvmomi 支持的类型
- django - 如何将情境字段添加到序列化程序?
- javascript - 使用一个 onChange 处理程序处理动态文本输入,并且在 React JS 中没有名称属性
- ansible - 调试http post请求ansible