mapreduce - CouchDB 视图每个键减少一个文档
问题描述
我正在尝试使用 couchDb 视图解决看似相当简单的问题,但我的结果集甚至没有接近目标。
我没有更新文档,而是每次都创建一个新文档作为我的版本控制策略,并将这些文档与一个名为ver
. 版本链中的第一个文档将看到具有相同值的ver
字段和字段。_id
链中的所有后续文档将具有与链ver
中先前文档相同的字段,但将具有唯一的_id
字段。这些文档也有一个createdTime
字段,我可以通过该字段了解哪个文档是最新的。
这是我的文件:
{
"_id": "abcd-1234-efgh-9876",
"ver": "abcd-1234-efgh-9876",
"createdTime": "2020-01-12 01:15:00 PM -0600",
...
},
{
"_id": "uopa-3849-pmdi-1935",
"ver": "abcd-1234-efgh-9876",
"createdTime": "2020-02-16 02:39:00 PM -0600",
...
}
这是我的地图功能:
function (doc) {
emit(doc.ver, doc);
}
这是我的减少功能:
function(keys, values, rereduce) {
var latestVersions = {};
for (var i = 0; i < keys.length; i++) {
var found = latestVersions[keys[i][0]];
if (!found || found.createdTime < values[i].createdTime) {
latestVersions[keys[i][0]] = values[i];
}
}
return latestVersions;
}
最后,这是我想要的视图输出(只是我想要的文档):
{
"_id": "uopa-3849-pmdi-1935",
"ver": "abcd-1234-efgh-9876",
"createdTime": "2020-02-16 02:39:00 PM -0600",
...
}
我在这里想念什么?reduce 函数返回两条记录,这不是我想要的。我正在努力实现的目标是可能的,还是有更好的方法来解决这个问题?
更新
当使用单个键访问视图时,我能够让它工作,这是我的用例之一。
function (keys, values, rereduce) {
var toReturn = values[0];
for (var i = 1; i < values.length; i++) {
if (values[i].createdTime > toReturn.createdTime) {
toReturn = values[i];
}
}
return toReturn;
}
但是,我还有另一个用例将返回视图中的所有数据。所需的结果与上面相同,但我用于单个键的函数将只返回一个结果。如何使用共享键过滤多个值,例如 1 个“共享”键:n 值 -> 1 个键:1 值。
解决方案
当我偶然发现这篇couchbase 文章时,我终于能够解决这个问题。它比其他一些枯燥的计算机科学文档清晰得多。
我仍然不明白为什么某些项目在 reduce 方法中分组,而其他项目则没有。例如,对于共享相同键的 6 个项目,reduce 被调用了 5 次;只有一个键实际上对任何内容进行了分组——两个文档的数组。这可能与我忽略的那些枯燥的计算机科学 B 树文档有关。
无论如何,我能够确定我需要做的就是ver
在两种情况下按字段对值进行分组(唯一的区别是 rereduce 有一个二维数组)。这是我的 reduce 函数最终的样子:
function (keys, values, rereduce) {
var toValues = function(myMap) {
return Object.keys(myMap).map(function(key) {
return myMap[key];
});
}
if (rereduce) {
// values should look like [[{...}, {...}], [{...}]]
var outputMap = {};
for (var i = 0; i < values.length; i++) {
for (var j = 0; j < values[i].length; j++) {
var currentEl = values[i][j];
var found = outputMap[currentEl.ver];
if ((found && found.createdDate < currentEl.createdDate) || !found) {
outputMap[currentEl.ver] = currentEl;
}
}
}
return toValues(outputMap);
} else {
var outputMap = {};
for (var i = 0; i < values.length; i++) {
var found = outputMap[values[i].ver];
if ((found && found.createdDate < values[i].createdDate) || !found) {
outputMap[values[i].ver] = values[i];
}
}
return toValues(outputMap);
}
}
推荐阅读
- android - Flutter 图像选择器崩溃
- javascript - 无限滚动:在滚动结束时在数组中添加元素后,数组列表不会在 *ngFor 中呈现
- html - 伪元素前后的额外像素
- go - 无法编组,(实现 encoding.BinaryMarshaler)。带有多个对象的 go-redis Sdd
- javascript - 迭代承诺
用 *ngFor? - javascript - 如何使用 puppeteer 单击 iframe 中的按钮?
- spring-boot - 如何在 Spring WebClient 中验证响应对象
- reactjs - 替换所有字符串并包装为 html
- python - 如何在我的 Visual Studio Code 扩展中使用 Python 路径?
- amazon-s3 - 从 Kafka 连接到 AWS S3 存储桶的数据包传输速度很慢。如何提高吞吐量