elasticsearch - 从最后一个 updated_on 日期推送数据
问题描述
所以我在我的 jdbc logstash 输入中使用以下查询。
statement => "SELECT * from mydata WHERE updated_on > :sql_last_value ORDER BY updated_on"
use_column_value =>true
tracking_column =>updated_on
tracking_column_type => "@timestamp"
或者
statement => "SELECT * from mydata WHERE :sql_last_value > updated_on ORDER BY updated_on"
use_column_value =>true
tracking_column =>updated_on
tracking_column_type => "@timestamp"
在这里,我的 :sql_last 值被认为是配置文件的最后运行时间。例子:
"updated_on": "2019-09-26T08:11:00.000Z",
"@timestamp": "2019-09-26T08:17:52.974Z"
这里我的 sql_last_value 对应于@timestamp,我希望它考虑 updated_on 。
如何更改它以考虑最后一个 updated_on 日期而不是执行时间?
解决方案
所以这是您当前的配置:
statement => "SELECT * from agedata WHERE updated_on > :sql_last_value ORDER BY updated_on"
use_column_value => true
tracking_column => updated_on
tracking_column_type => "timestamp"
它所说的基本上是该sql_last_value
变量将存储/记住updated_on
上次运行以来列的最后一个use_column_value
值true
(不是您建议的上次运行时间值,否则use_column_value
将是false
)。
因此,您的配置已经达到了您的预期。
推荐阅读
- laravel - Laravel,独特的列
- suitecrm - 在 SuiteCRM 中,仪表板未显示在主页中
- colors - notepad++ 我想做所有我写的数字都有不同的颜色
- python - 如何实现一个与“标签”具有多对多关系的 Django 模型,但还要计算它被标记了多少次?
- ruby - 如何在 Ruby 中跨类使用用户输入?
- c++ - Ranges算法和std算法的区别
- python - 如何使用 python tkinter 将一个窗口调用到另一个窗口
- python - 我如何通过python解决线性方程的错误
- ansible - 如何在ansible playbook中为主机声明两个提示变量
- apache-kafka - Kafka 再平衡算法是否在主题之间保持平衡?