首页 > 解决方案 > Cloud Spanner 不应该使用二级索引

问题描述

使用主键快速执行的现有查询在没有通知的情况下大幅减慢(10ms -> 8sec),因为现在自动使用为另一个用例创建的二级索引。

Cloud-Spanner-Web-Query 的“解释”告诉我使用了二级索引。如果我更改排序(仅出于测试目的)或提供 FORCE_INDEX 查询又会很快。

我可以使用Cloud Spanner 查询语法文档中记录的FORCE_INDEX=_BASE_TABLE来“解决”这个问题。

我的问题是:我真的必须为每个查询都这样做以避免这种影响吗?

这将查询定义与索引定义混合在一起,恕我直言,这不是一件好事。

具有主索引的表:

CREATE TABLE change_history (
    userId INT64 NOT NULL,
    createdAtUnique INT64 NOT NULL,
    itemId STRING(512) NOT NULL,
    newValue FLOAT64 NOT NULL,
    oldValue FLOAT64 NOT NULL,
) PRIMARY KEY (userId, itemId, createdAtUnique DESC)

二级指标:

CREATE INDEX ch_userid_createdatunique_all ON change_history (
    userId,
    createdAtUnique
) STORING (
    newValue,
    oldValue
)

原始查询:

SELECT * FROM change_history WHERE                         
    userId = 2563
    AND itemId = "215414"
    AND createdAtUnique >= 15385766670000000
    AND createdAtUnique <= 15465254670000000 ORDER BY createdAtUnique

我希望查询继续使用它设计的主键。

但是通过添加二级索引,查询开始使用这个索引而不是主键。

标签: google-cloud-platformgoogle-cloud-spanner

解决方案


在这种情况下,查询优化器决定选择索引,因为 1) 它是覆盖的;2) 避免在原始计划中进行排序,因为索引包含createdAtUnique升序排序,这是查询中请求的排序顺序。但是,对于您的数据分布,这被证明是一个糟糕的选择。

通常,对于经过手动调整以获得您知道是最佳/良好的特定计划的查询,最好在查询中使用force_indexjoin_type提示来防止优化器可能选择不同计划的罕见实例。


推荐阅读