【问题描述】:

我正在徘徊是否在聚合管道中为嵌套数组的文档使用 $unwind 运算符是否会以与数组中项目的顺序相同的顺序返回解构的文档。 例子: 假设我有以下文件

 "_id" : 1, "item" : "foo", values: [ "foo", "foo2", "foo3"] 
 "_id" : 2, "item" : "bar", values: [ "bar", "bar2", "bar3"] 
 "_id" : 3, "item" : "baz", values: [ "baz", "baz2", "baz3"] 

我想在我的应用程序代码中对所有文档中的所有值使用分页。所以,我的想法是使用 mongo 聚合框架来:

    按_id对文档进行排序 在values 属性上使用$unwind 来解构文档 使用 $skip 和 $limit 来模拟分页



    $sort: "_id": 1,
    $unwind: "$values"


 "_id" : 1, "item" : "foo", values: "foo" 
 "_id" : 1, "item" : "foo", values: "foo2" 
 "_id" : 1, "item" : "foo", values: "foo3" 
 "_id" : 2, "item" : "bar", values: "bar" 
 "_id" : 2, "item" : "bar", values: "bar2" 
 "_id" : 2, "item" : "bar", values: "bar3" 
 "_id" : 3, "item" : "baz", values: "baz" 
 "_id" : 3, "item" : "baz", values: "baz2" 
 "_id" : 3, "item" : "baz", values: "baz3" 

【问题讨论】:

我也在MongoDB community forum 中问过同样的问题。一个证实我假设的答案是从 MongoDB 的成员发布的。





如果您确实遇到订单问题。您可以使用includeArrayIndex 来保证订单。

   path: 'values',
   includeArrayIndex: 'arrayIndex'
   _id: 1,
   arrayIndex: 1
    index: 0


【参考方案3】:

根据我在 看到的情况

游标迭代器使用 getNext() 方法展开数组:

DocumentSource::GetNextResult DocumentSourceUnwind::doGetNext() 
    auto nextOut = _unwinder->getNext();
    while (nextOut.isEOF()) 
        // Try to extract an output document from the new input document.
        nextOut = _unwinder->getNext();

    return nextOut;

getNext() 的实现依赖于数组的索引:

DocumentSource::GetNextResult DocumentSourceUnwind::Unwinder::getNext() 

            // Set field to be the next element in the array. If needed, this will automatically
            // clone all the documents along the field path so that the end values are not shared
            // across documents that have come out of this pipeline operator. This is a partial deep
            // clone. Because the value at the end will be replaced, everything along the path
            // leading to that will be replaced in order not to share that change with any other
            // clones (or the original).
            _output.setNestedField(_unwindPathFieldIndexes, _inputArray[_index]);
            indexForOutput = _index;
            _haveNext = _index < length;

    return _haveNext ? _output.peek() : _output.freeze();


我不记得合并对于分片集合是如何工作的,我想可能会有这样的情况,即来自其他分片的文档从 2 个连续展开的文档之间返回。代码的 sn-p 保证的是,在展开包含数组中上一项的文档之前,永远不会返回包含数组中下一项的展开文档。

顺便说一句,在一个数组中包含数百万个项目是一个非常极端的设计。即使是数组中 20 字节的项目,也会超过 16Mb 的文档限制。


非常感谢您为回答这个问题所做的努力。你说的对。几个小时前,MongoDB Stuff 的一名成员在我提出这个问题的其他沟通渠道中证实了这一点。如果可能的话,我会添加一个带有指向它的链接的答案。 很高兴您解决了您的问题。 member of staff 是聚合框架之母 =) 你几乎找不到更可靠的来源。

