首页 > 解决方案 > 如何从弹性搜索中获取数据,如果有新数据则更新它,然后再次注入?

问题描述

我的 Pandas Dataframe 中有近 200 000 行元组。我将这些数据注入到弹性搜索中。现在,当我运行程序时,它应该检查弹性搜索中是否已经存在现有数据,如果不存在则插入其中。

标签: python-3.xpandaselasticsearchelasticsearch-py

解决方案


我建议不要担心它,只需将所有内容加载到 Elasticsearch 中即可。只要您_id的 s 是一致的,现有的文档将被覆盖而不是重复。因此,只需确保_id为每个文档指定一个值就可以了,客户端bulk中的助手elasticsearch-py都支持您_id为每个文档设置一个值。


推荐阅读