elasticsearch - 是否可以编辑弹性搜索快照
问题描述
我最近开始从事一个需要处理弹性搜索的项目。作为这项技术的新手,我在以下情况下做出决定时有点不舒服。
我确实看到集群的一些快照是空的,因此我的数据表示模块显示的是曲折线。我知道引入的空快照会错误地从现有索引中重新索引索引。
对于某些快照,由于同一索引被复制两次到快照中,因此数据在其中重复,这再次导致我的数据呈现模块上的图形具有曲折性质。
所以我想知道的是我是否有名为 A、B、C、D 的快照。所有这些都是从 A 派生的,但不幸的是 B 是空的(由于某些逻辑问题,数据没有从 A 复制到 B)并且 D 是双倍的大小为 A(引入了重复项)。我想将 B 作为 A 的副本,将 D 作为 C 的副本。
有人可以建议我如何解决这个问题。提前致谢。
还有可能在快照中找到重复项并删除它们吗?
解决方案
我认为在查看您的问题之前值得讨论一下
相同存储库中相同索引的快照是增量的 - 只要索引的段不更改
这意味着如果这些索引的段不随时间变化,那么 Elasticsearch 可以判断没有变化,因此不会复制数据。如果进行了更改,则将拍摄新的快照
https://www.elastic.co/guide/en/elasticsearch/reference/7.15/snapshot-restore.html对此有更多了解,https://steve-mushero.medium.com/how-elasticsearch-snapshots-work -3824fdfc4493也很好读
要回答您的直接问题,我们需要更多地了解您在这些快照之间所做的事情,以及当您说存在“逻辑问题”时所看到的内容,以及“引入的重复”评论
推荐阅读
- javascript - 在自定义元素(Web 组件)中使用文档
- heap-corruption - C - 释放数组时检测到堆损坏
- r - 如何使用条件来摆脱 R 中的行
- google-apps-script - 在所有工作表中搜索在其旁边的单元格中具有特定值的字符串
- git - 作为使用课程 GitHub 存储库的学生,我应该克隆还是分叉存储库以保持个人学习?
- scipy - scipy.optimize.curve_fit 和线性最小二乘法之间的区别
- javascript - 您可能需要适当的加载器来处理这种文件类型,目前没有配置加载器 import Counter from './components/counter.jsx'
- powershell - 将输出设为无限或 Nan
- php - 当我使用mysql将图像上传到数据库时,php中的未定义索引
- vue.js - vue 基于多数据的动态 vlaue