marklogic - 光学 API:如何获取具有最大值的列的值?
问题描述
我的数据集有两个数组,其中包含两个属性,一个日期和一个值。对于每个数组,我需要获取具有最新日期的对象。我正在尝试从索引中执行此操作,并正在探索使用光学 API 进行查询。
我的视图有三列:“statusType”,表示值来自哪个数组;“状态日期”;和“价值”。通过以下查询,我可以获得每种类型的最新日期,但我不知道如何获得与之相关的值。
const op = require('/MarkLogic/optic');
op.fromView('Parent', 'info')
.where(cts.documentQuery('/test/doc1.json'))
.groupBy([op.col('statusType')], [op.max('maxdate', op.col('statusDate'))])
.result()
产生:
{
"statusType": "subtype1",
"maxdate": "2020-09-29T16:33:18.6301434-04:00"
},
{
"statusType": "subtype2",
"maxdate": "2020-08-29T16:33:18.6301434-04:00"
}
如果我将value
第一个参数添加到groupBy
,我会得到类型和值的所有不同组合(使用 maxdate)。如果我将value
第二个参数添加到groupBy
,我会得到最后一个值,而不是与maxdate
.
预期输出:
{
"statusType": "subtype1",
"value": "valueB",
"maxdate": "2020-09-29T16:33:18.6301434-04:00"
},
{
"statusType": "subtype2",
"value": "valueC",
"maxdate": "2020-08-29T16:33:18.6301434-04:00"
}
样本数据:
'use strict';
declareUpdate();
xdmp.documentInsert(
'/test/doc1.json',
{
"parent": {
"subtype1": [
{
"value": "valueA",
"date": "2020-07-29T16:33:18.6301434-04:00"
},
{
"value": "valueB",
"date": "2020-09-29T16:33:18.6301434-04:00"
}
],
"subtype2": [
{
"value": "valueC",
"date": "2020-08-29T16:33:18.6301434-04:00"
},
{
"value": "valueD",
"date": "2020-07-29T16:33:18.6301434-04:00"
}
]
}
}
)
模板 1:
declareUpdate();
const tde = require("/MarkLogic/tde.xqy");
let template =
xdmp.toJSON(
{
"template": {
"context": "/parent/subtype1",
"rows": [
{
"schemaName": "Parent",
"viewName": "info",
"columns": [
{
"name": "statusType",
"scalarType": "string",
"val": "'subtype1'"
},
{
"name": "value",
"scalarType": "string",
"val": "value"
},
{
"name": "statusDate",
"scalarType": "dateTime",
"val": "date"
}
]
}
]
}
}
);
// comment and uncomment based on which action you want to take
let action =
//'validate'
//'extract'
'insert'
;
if (action === 'validate') {
tde.validate([template]);
} else if (action === 'extract') {
tde.nodeDataExtract([cts.doc( "/test/doc1.json" )], [template])
} else if (action === 'insert') {
tde.templateInsert("/tde/subtype1.json", template, xdmp.defaultPermissions(), ["TDE"])
}
模板 2:
declareUpdate();
const tde = require("/MarkLogic/tde.xqy");
let template =
xdmp.toJSON(
{
"template": {
"context": "/parent/subtype2",
"rows": [
{
"schemaName": "Parent",
"viewName": "info",
"columns": [
{
"name": "statusType",
"scalarType": "string",
"val": "'subtype2'"
},
{
"name": "value",
"scalarType": "string",
"val": "value"
},
{
"name": "statusDate",
"scalarType": "dateTime",
"val": "date"
}
]
}
]
}
}
);
// comment and uncomment based on which action you want to take
let action =
//'validate'
//'extract'
'insert'
;
if (action === 'validate') {
tde.validate([template]);
} else if (action === 'extract') {
tde.nodeDataExtract([cts.doc( "/test/doc1.json" )], [template])
} else if (action === 'insert') {
tde.templateInsert("/tde/subtype2.json", template, xdmp.defaultPermissions(), ["TDE"])
}
解决方案
问候,卡塞尔先生:
如果我正确理解了要求,我知道的唯一方法是将groupBy()
结果与原始视图相结合:
- 发出具有分组键和 max() 聚合值的
groupBy()
行,在访问器上传递别名/限定符名称fromView()
。 - 通过加入相同的视图(在 maxInfo.statusType=info.statusType 和 maxInfo.maxdate=info.statusDate 上使用联接键)来获取最大行的其余列。
该groupBy()
操作对聚合参数中的任何列进行采样。
希望有帮助,
推荐阅读
- excel - 如何从导入的文件中删除重复项?
- python - 长正则表达式替换需要多次通过才能完成 - 为什么?
- python - 尝试生成虚拟 DataFrame 但出现错误
- c# - 创建一个 EntryPoint.Invoke(null, null); 在 MethodInfo 下并调用它
- groovy - 在声明性 Jenkins 管道中存储环境变量中的值列表
- mysql - 逐一获取列数据
- r - 从 R 调用 openmp 的 C 代码给出不一致的结果
- php - 如何从gmail API的邮件中提取PHP中的html数据?
- mule - 如何在不使用 API 管理器的情况下在 Mule 4 中配置 CORS?
- angular - 为什么在导入文本编码 polyfill 后在 IE11 中出现“ReferenceError: 'TextEncoder' is undefined”?