indexing - gcp 云数据存储索引策略
问题描述
数据存储新手,但熟悉 Cassandra 和 Dynamo。我有一个用例,其中我有一个由两个字段 ( A
, B
) 组成的唯一复合键。B
将是desc
有序的。我的访问模式是查询给定值(带分页)的最新(基于B
)实体。A
我的问题是它A
可能具有非常高的基数(可能在 5-1000 万范围内,但低至 100-1000)。
如果这是在 Dynamo 中,我将A
成为分区键并B
成为排序键。然而,在 Datastore 中,密钥标识符的概念让我大吃一惊。我应该将唯一的 CONCAT(A,B) 作为关键标识符(以实现某种唯一约束)吗?A
然后B
一次又一次地为查询添加一个索引?
我找不到关于 Datastore 内部工作的太多信息,所以我不确定是否将 CONCAT(A,B) 作为关键标识符会随机分布数据。我猜测对于快速查询,我希望所有具有相同A
值的实体都存储在同一个分区中。或者索引是否像关系数据库中的视图一样工作?
解决方案
推荐阅读
- eclipse - 如何收听“项目资源管理器”插件中的比较事件?
- php - 仅在帖子类型页面中显示产品价格元素
- java - 使用括号中的 JSON 值查询 Apache Solr
- scala - 适应反应的目的是什么?
- r - 如何更改 export_summs (R) 中的 p 值星截止值
- apache-spark - 使用 Spark 和 Alluxio 管理 S3 的文件大小
- javascript - 是否可以从 HTML 网络资源刷新 Dynamics CRM 子网格?
- python - 想要找到具有最多素数除数的数字,但它一直打印最后输入的数字及其除数
- angular - http.get() 不返回 observable
- amazon-web-services - 为什么ecs-cli service up很久没有完成