python-3.x - 如何从弹性搜索中获取数据,如果有新数据则更新它,然后再次注入?
问题描述
我的 Pandas Dataframe 中有近 200 000 行元组。我将这些数据注入到弹性搜索中。现在,当我运行程序时,它应该检查弹性搜索中是否已经存在现有数据,如果不存在则插入其中。
解决方案
我建议不要担心它,只需将所有内容加载到 Elasticsearch 中即可。只要您_id
的 s 是一致的,现有的文档将被覆盖而不是重复。因此,只需确保_id
为每个文档指定一个值就可以了,客户端bulk
中的助手elasticsearch-py
都支持您_id
为每个文档设置一个值。
推荐阅读
- symfony - 尝试使用 Swiftmailer 加载类“Swift_Attachment”
- php - Quickbooks 错误:属性 IsProject 不存在。IPPCustomer 类
- omnet++ - 是否有可能在 Veins 中使用当前的夜间版本的 SUMO?
- java - 将数据从 Java 进程传递到 python 脚本
- plantuml - PlantUML,列重排
- tensorflow - Keras 自定义损失:我如何知道哪些模式对应于 y_pred 和 y_true?
- c - 无法在 C 中打开文件 - 在 C 中打开文件时出错
- python - 在一个图中绘制不同数据框的不同列作为散点图
- spring-boot - 没有服务层的springboot项目
- android - 在 Unity 应用程序中初始化 Firebase 时出现 Native NullPointerException