pagination - 没有顺序唯一ID(例如位置)的搜索结果的基于光标的分页
问题描述
我正在尝试为用户可以按位置(lat、lng)搜索和排序的数据实现基于光标的分页。一个简化的示例是假设一个名为“可搜索”的实体。它将具有其唯一的主键“id”字段和位置字段“lat”、“lng”。
在我按距特定点的距离订购后,'id's 将被弄乱。似乎没有唯一的顺序 id 可用作游标。我也不能使用“lat”和“lng”,因为搜索和排序是按半径/距离,这意味着“lat”和“lng”也没有顺序。
这是否意味着基于游标的分页不适合此类查询?或者有什么方法可以为这种情况实现游标?
解决方案
我认为即使在这种情况下你也可以实现基于光标的分页。
首先,您说您的结果是按与某个点的距离排序的。我假设它是用户可以指定的某个起点的距离(比如要求地图应用程序“显示我附近的餐馆”)。在这种情况下,游标值不是静态的,不能存储在您的可搜索记录中。它必须根据用户输入来计算。通过即时计算游标,您将失去游标分页 [1] 的优势之一 - 对大型结果集具有良好的有效性。这是因为您不能简单地使用数据库索引来跳过游标值“低于”指定值的记录。
[1] 有关光标分页优缺点的更多信息,请参阅 Slack 工程师的这篇文章:https ://slack.engineering/evolving-api-pagination-at-slack-1c1f644f8e12 。
其次,距离本身可能不足以进行明确的排序,因为两个不同的可搜索s 与起点的距离可能相同。为了解决这个问题,您可以添加 ID 作为辅助排序字段,这将使顺序确定性(或数学术语中的总顺序)。
距离和 ID 一起形成一个可以用作光标的值。
例如,假设当前页面上的最后一个结果的距离为 123.45 公里(或您使用的任何单位)并且 ID 为 98765。
这将转换为以下光标:
{
distance: 123.45,
id: 98765
}
当您想“转到下一页”时,您只需在使用此光标进行搜索后请求 10 个(或您的页面大小) searchable 。
如果您熟悉 SQL,它将转换为如下查询:
SELECT s.*
FROM searchables s
WHERE get_distance(stating_point, s) > 123.45
OR get_distance(stating_point, s) = 123.45 AND s.id > 98765
LIMIT 10
其中get_distance(a, b)
函数计算点a
和之间的距离b
。
实际上,如果距离和 ID 都可以在某个范围内限定,您可以使用一个聪明的技巧并将光标编码为单个字符串,其字典顺序将对应于结果的顺序 - 例如。“0000000123.4500-0000098765”。
这样 SQL 查询可以简化为:
SELECT s.*
FROM searchables s
WHERE get_cursor(get_distance(stating_point, s), s.id) > '0000000123.4500-0000098765'
LIMIT 10
其中get_cursor(distance, id)
函数将距离和 ID 格式化为建议格式的字符串。
推荐阅读
- python - 如果缺少密钥,如何使用 ceberus 发出警告?
- php - 不推荐使用:不推荐使用带有花括号的数组和字符串偏移访问语法
- amazon-web-services - 如何使用 s3.select_object_content 查询存储桶中的所有对象?
- javascript - × 错误:重新渲染过多。React 限制渲染次数以防止无限循环
- node.js - 未找到模块:错误:无法在 webpack.common.js 中解析
- python - 如果它们都匹配第一列,则比较两个文件,然后替换第 2 列和第 3 列的值(Python)
- dataset - 是否有产品数据集(UPC/EAN 级别)及其回收信息?
- ajax - 使用ajax将值从一个控制器视图传递到另一个控制器视图的codeigniter
- html - 图片在右边,文字在左边
- angular - 将订阅响应作为参数发送到方法 Angular/rxJs