python - Elasticsearch 和 S3 存储桶:如何让 Python 检测来自 s3 存储桶的数据是否已经在弹性搜索中?
问题描述
我对 Elasticsearch 非常陌生,我似乎找不到可以帮助我让 Python 检测我在 s3 存储桶中的文档中的数据是否已经上传到 elasticsearch 的答案。我的目标是让它查看来自 s3 存储桶的数据是否已经在其中,如果是则跳过它,然后移动到下一个,直到它找到一个尚未上传数据的文档。有人能帮助我吗?
解决方案
我认为最简单的方法是使用 DynamoDB 来存储这类信息。因此,您上传到 ES 的每个文件都会在 DDB 中获得一条记录。因此,您始终可以通过检查 DDB 中是否存在记录来验证文件是否已上传到 ES。
推荐阅读
- javascript - 如何为会话仅显示一次 div
- google-api - ColdFusion Google OAuth 获取访问令牌连接失败
- c - 在字符串中的特定字符后添加字符
- nativescript - 使用扩展 AppCompatDialog 的 Android 库
- c++ - cmake中的安装命令是什么?
- c# - ZipArchive 使用 Zip 文件创建条目以存储流
- javascript - 在 highchart 中绘制 JSON 结果
- node.js - npm 的包审计是否使用 OWASP?
- javascript - 使用 VueJS、VuelidateJS 和 NodeJS/Express 时的项目结构
- networking - VMWare NAT 模式来宾无法访问 Internet