mongodb Aggregation聚合操作之$facet
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了mongodb Aggregation聚合操作之$facet相关的知识,希望对你有一定的参考价值。
参考技术A 在上一篇 mongodb Aggregation聚合操作之$collStats 中详细介绍了mongodb聚合操作中的$collStats使用以及参数细节。本篇将开始介绍Aggregation聚合操作中的$facet操作。说明:
在同一组输入文档的单一阶段中处理多个聚合管道。每个子管道在输出文档中都有自己的字段,其结果存储在文档数组中。$facet阶段允许您在单个聚合阶段内创建多面聚合,这些聚合描述了跨多个维度(或多个方面)的数据。多面聚合提供多个过滤器和分类来指导数据浏览和分析,$facet在同一组输入文档上支持各种聚合,而不需要多次检索输入文档。
语法:
$facet:
<outputField1>: [ <stage1>, <stage2>, ... ],
<outputField2>: [ <stage1>, <stage2>, ... ],
...
注意:
$facet阶段及其子管道不能使用索引,即使它的子管道使用$match,或者$facet是管道中的第一阶段。$facet阶段将始终在执行期间执行COLLSCAN。
初始化数据:
db.artwork.insertMany([ "_id" : 1, "title" : "The Pillars of Society", "artist" : "Grosz", "year" : 1926,
"price" : NumberDecimal("199.99"),
"tags" : [ "painting", "satire", "Expressionism", "caricature" ] ,
"_id" : 2, "title" : "Melancholy III", "artist" : "Munch", "year" : 1902,
"price" : NumberDecimal("280.00"),
"tags" : [ "woodcut", "Expressionism" ] ,
"_id" : 3, "title" : "Dancer", "artist" : "Miro", "year" : 1925,
"price" : NumberDecimal("76.04"),
"tags" : [ "oil", "Surrealism", "painting" ] ,
"_id" : 4, "title" : "The Great Wave off Kanagawa", "artist" : "Hokusai",
"price" : NumberDecimal("167.30"),
"tags" : [ "woodblock", "ukiyo-e" ] ,
"_id" : 5, "title" : "The Persistence of Memory", "artist" : "Dali", "year" : 1931,
"price" : NumberDecimal("483.00"),
"tags" : [ "Surrealism", "painting", "oil" ] ,
"_id" : 6, "title" : "Composition VII", "artist" : "Kandinsky", "year" : 1913,
"price" : NumberDecimal("385.00"),
"tags" : [ "oil", "painting", "abstract" ] ,
"_id" : 7, "title" : "The Scream", "artist" : "Munch", "year" : 1893,
"tags" : [ "Expressionism", "painting", "oil" ] ,
"_id" : 8, "title" : "Blue Flower", "artist" : "O'Keefe", "year" : 1918,
"price" : NumberDecimal("118.42"),
"tags" : [ "abstract", "painting" ] ])
示例:
db.artwork.aggregate( [
$facet:
"categorizedByTags": [
$unwind: "$tags" ,
$sortByCount: "$tags"
],
"categorizedByPrice": [
// Filter out documents without a price e.g., _id: 7
$match: price: $exists: 1 ,
$bucket:
groupBy: "$price",
boundaries: [ 0, 150, 200, 300, 400 ],
default: "Other",
output:
"count": $sum: 1 ,
"titles": $push: "$title"
],
"categorizedByYears(Auto)": [
$bucketAuto:
groupBy: "$year",
buckets: 4
]
])
结果:
[ categorizedByTags:
[ _id: 'painting', count: 6 ,
_id: 'oil', count: 4 ,
_id: 'Expressionism', count: 3 ,
_id: 'abstract', count: 2 ,
_id: 'Surrealism', count: 2 ,
_id: 'ukiyo-e', count: 1 ,
_id: 'woodblock', count: 1 ,
_id: 'woodcut', count: 1 ,
_id: 'satire', count: 1 ,
_id: 'caricature', count: 1 ],
categorizedByPrice:
[ _id: 0, count: 2, titles: [ 'Dancer', 'Blue Flower' ] ,
_id: 150,
count: 2,
titles: [ 'The Pillars of Society', 'The Great Wave off Kanagawa' ] ,
_id: 200, count: 1, titles: [ 'Melancholy III' ] ,
_id: 300, count: 1, titles: [ 'Composition VII' ] ,
_id: 'Other',
count: 1,
titles: [ 'The Persistence of Memory' ] ],
'categorizedByYears(Auto)':
[ _id: min: null, max: 1902 , count: 2 ,
_id: min: 1902, max: 1918 , count: 2 ,
_id: min: 1918, max: 1926 , count: 2 ,
_id: min: 1926, max: 1931 , count: 2 ] ]
mongodb Aggregation聚合操作之$sort
参考技术A 在上一篇 mongodb Aggregation聚合操作之$match 中详细介绍了mongodb聚合操作中的$match使用以及参数细节。本篇将开始介绍Aggregation聚合操作中的$sort操作。说明:
对所有输入文档进行排序,并将它们按排序顺序返回到管道。
语法:
$sort: <field1>: <sort order>, <field2>: <sort order> ...
$sort接收一个文档,该文档指定要排序的字段和相应的排序顺序。<排序顺序>可以有以下值之一:
1:升序排序
-1:降序排序
$meta: "textScore" :按计算的textScore元数据降序排序。
注意【如果对多个字段进行排序,则从左到右计算排序顺序。例如,在上面的表单中,文档首先按<field1>排序。然后,具有相同<field1>值的文档按<field2>进一步排序。】示例
对于要排序的字段或字段,将排序顺序设置为1或-1,分别指定升序或降序排序,如下例所示:该操作对users集合中的文档进行排序,根据age字段降序排列,然后根据posts字段中的值升序排列。
db.users.aggregate(
[
$sort : age : -1, posts: 1
]
)
在<sort-key>文档中指定计算出的元数据的新字段名,并指定$meta表达式作为它的值,如下面的示例所示:该操作使用$text操作符匹配文档,然后首先按“textScore”元数据排序,然后按posts字段的降序排序。指定的元数据决定排序顺序。例如,“textScore”元数据按降序排序。
db.users.aggregate(
[
$match: $text: $search: "operating" ,
$sort: score: $meta: "textScore" , posts: -1
]
)
$sort + $limit内存优化
当$sort在$limit之前并且没有修改文档数量的中间阶段时,优化器可以将$limit合并到$sort中。这允许$sort操作在进行过程中只维护顶部的n个结果,其中n是指定的限制,并确保MongoDB只需要在内存中存储n个项目。当allowDiskUse为true且n项超过聚合内存限制时,这种优化仍然适用。优化可能会在不同版本之间发生变化。
$sort阶段的RAM有100兆字节的限制。默认情况下,如果阶段超过这个限制,$sort将产生一个错误。为了允许处理大型数据集,将allowDiskUse选项设置为true,以允许$sort操作写入临时文件。有关详细信息,请参阅db.collection.aggregate()方法中的allowDiskUse选项和aggregate命令。
版本2.6中的变化:$sort的内存限制从RAM的10%更改为100兆字节。
如果将$sort操作符放置在管道的开头,或放置在$project、$unwind和$group聚合操作符之前,则可以利用索引。如果$project、$unwind或$group发生在$sort操作之前,则$sort不能使用任何索引
以上是关于mongodb Aggregation聚合操作之$facet的主要内容,如果未能解决你的问题,请参考以下文章
mongodb Aggregation聚合操作之$bucket
Ruby操作MongoDB(进阶八)-聚合操作Aggregation