mongodb Aggregation聚合操作之$facet

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了mongodb Aggregation聚合操作之$facet相关的知识,希望对你有一定的参考价值。

参考技术A 在上一篇 mongodb Aggregation聚合操作之$collStats 中详细介绍了mongodb聚合操作中的$collStats使用以及参数细节。本篇将开始介绍Aggregation聚合操作中的$facet操作。

说明:

在同一组输入文档的单一阶段中处理多个聚合管道。每个子管道在输出文档中都有自己的字段,其结果存储在文档数组中。$facet阶段允许您在单个聚合阶段内创建多面聚合,这些聚合描述了跨多个维度(或多个方面)的数据。多面聚合提供多个过滤器和分类来指导数据浏览和分析,$facet在同一组输入文档上支持各种聚合,而不需要多次检索输入文档。

语法:

$facet:

   

      <outputField1>: [ <stage1>, <stage2>, ... ],

      <outputField2>: [ <stage1>, <stage2>, ... ],

      ...

   



注意:

$facet阶段及其子管道不能使用索引,即使它的子管道使用$match,或者$facet是管道中的第一阶段。$facet阶段将始终在执行期间执行COLLSCAN。

初始化数据:

db.artwork.insertMany([ "_id" : 1, "title" : "The Pillars of Society", "artist" : "Grosz", "year" : 1926,

  "price" : NumberDecimal("199.99"),

  "tags" : [ "painting", "satire", "Expressionism", "caricature" ] ,

"_id" : 2, "title" : "Melancholy III", "artist" : "Munch", "year" : 1902,

  "price" : NumberDecimal("280.00"),

  "tags" : [ "woodcut", "Expressionism" ] ,

"_id" : 3, "title" : "Dancer", "artist" : "Miro", "year" : 1925,

  "price" : NumberDecimal("76.04"),

  "tags" : [ "oil", "Surrealism", "painting" ] ,

"_id" : 4, "title" : "The Great Wave off Kanagawa", "artist" : "Hokusai",

  "price" : NumberDecimal("167.30"),

  "tags" : [ "woodblock", "ukiyo-e" ] ,

"_id" : 5, "title" : "The Persistence of Memory", "artist" : "Dali", "year" : 1931,

  "price" : NumberDecimal("483.00"),

  "tags" : [ "Surrealism", "painting", "oil" ] ,

"_id" : 6, "title" : "Composition VII", "artist" : "Kandinsky", "year" : 1913,

  "price" : NumberDecimal("385.00"),

  "tags" : [ "oil", "painting", "abstract" ] ,

"_id" : 7, "title" : "The Scream", "artist" : "Munch", "year" : 1893,

  "tags" : [ "Expressionism", "painting", "oil" ] ,

"_id" : 8, "title" : "Blue Flower", "artist" : "O'Keefe", "year" : 1918,

  "price" : NumberDecimal("118.42"),

  "tags" : [ "abstract", "painting" ] ])

示例:

db.artwork.aggregate( [

  

    $facet:

      "categorizedByTags": [

         $unwind: "$tags" ,

         $sortByCount: "$tags"

      ],

      "categorizedByPrice": [

        // Filter out documents without a price e.g., _id: 7

         $match: price: $exists: 1 ,

        

          $bucket:

            groupBy: "$price",

            boundaries: [  0, 150, 200, 300, 400 ],

            default: "Other",

            output:

              "count": $sum: 1 ,

              "titles": $push: "$title"

            

          

        

      ],

      "categorizedByYears(Auto)": [

        

          $bucketAuto:

            groupBy: "$year",

            buckets: 4

          

        

      ]

    

  

])

结果:

[ categorizedByTags:

     [ _id: 'painting', count: 6 ,

        _id: 'oil', count: 4 ,

        _id: 'Expressionism', count: 3 ,

        _id: 'abstract', count: 2 ,

        _id: 'Surrealism', count: 2 ,

        _id: 'ukiyo-e', count: 1 ,

        _id: 'woodblock', count: 1 ,

        _id: 'woodcut', count: 1 ,

        _id: 'satire', count: 1 ,

        _id: 'caricature', count: 1 ],

    categorizedByPrice:

     [ _id: 0, count: 2, titles: [ 'Dancer', 'Blue Flower' ] ,

        _id: 150,

         count: 2,

         titles: [ 'The Pillars of Society', 'The Great Wave off Kanagawa' ] ,

        _id: 200, count: 1, titles: [ 'Melancholy III' ] ,

        _id: 300, count: 1, titles: [ 'Composition VII' ] ,

        _id: 'Other',

         count: 1,

         titles: [ 'The Persistence of Memory' ] ],

    'categorizedByYears(Auto)':

     [ _id: min: null, max: 1902 , count: 2 ,

        _id: min: 1902, max: 1918 , count: 2 ,

        _id: min: 1918, max: 1926 , count: 2 ,

        _id: min: 1926, max: 1931 , count: 2 ] ]

mongodb Aggregation聚合操作之$sort

参考技术A 在上一篇 mongodb Aggregation聚合操作之$match 中详细介绍了mongodb聚合操作中的$match使用以及参数细节。本篇将开始介绍Aggregation聚合操作中的$sort操作。

说明:

 对所有输入文档进行排序,并将它们按排序顺序返回到管道。

语法:

  $sort: <field1>: <sort order>, <field2>: <sort order> ...

$sort接收一个文档,该文档指定要排序的字段和相应的排序顺序。<排序顺序>可以有以下值之一:

1:升序排序

-1:降序排序

$meta: "textScore" :按计算的textScore元数据降序排序。

注意【如果对多个字段进行排序,则从左到右计算排序顺序。例如,在上面的表单中,文档首先按<field1>排序。然后,具有相同<field1>值的文档按<field2>进一步排序。】示例

对于要排序的字段或字段,将排序顺序设置为1或-1,分别指定升序或降序排序,如下例所示:该操作对users集合中的文档进行排序,根据age字段降序排列,然后根据posts字段中的值升序排列。

db.users.aggregate(

   [

      $sort : age : -1, posts: 1

   ]

)

在<sort-key>文档中指定计算出的元数据的新字段名,并指定$meta表达式作为它的值,如下面的示例所示:该操作使用$text操作符匹配文档,然后首先按“textScore”元数据排序,然后按posts字段的降序排序。指定的元数据决定排序顺序。例如,“textScore”元数据按降序排序。

db.users.aggregate(

   [

      $match: $text: $search: "operating" ,

      $sort: score: $meta: "textScore" , posts: -1

   ]

)

$sort + $limit内存优化

当$sort在$limit之前并且没有修改文档数量的中间阶段时,优化器可以将$limit合并到$sort中。这允许$sort操作在进行过程中只维护顶部的n个结果,其中n是指定的限制,并确保MongoDB只需要在内存中存储n个项目。当allowDiskUse为true且n项超过聚合内存限制时,这种优化仍然适用。优化可能会在不同版本之间发生变化。

$sort阶段的RAM有100兆字节的限制。默认情况下,如果阶段超过这个限制,$sort将产生一个错误。为了允许处理大型数据集,将allowDiskUse选项设置为true,以允许$sort操作写入临时文件。有关详细信息,请参阅db.collection.aggregate()方法中的allowDiskUse选项和aggregate命令。

版本2.6中的变化:$sort的内存限制从RAM的10%更改为100兆字节。

如果将$sort操作符放置在管道的开头,或放置在$project、$unwind和$group聚合操作符之前,则可以利用索引。如果$project、$unwind或$group发生在$sort操作之前,则$sort不能使用任何索引

以上是关于mongodb Aggregation聚合操作之$facet的主要内容,如果未能解决你的问题,请参考以下文章

mongodb Aggregation聚合操作之$bucket

Ruby操作MongoDB(进阶八)-聚合操作Aggregation

MongoDB Aggregation

MongoDB 聚合管道(Aggregation Pipeline)

基于 MongoDB 动态字段设计的探索 聚合操作

MongoDB 聚合管道(Aggregation Pipeline)