MongoDB中的多重限制条件
Posted
技术标签:
【中文标题】MongoDB中的多重限制条件【英文标题】:Multiple limit condition in mongodb 【发布时间】:2014-08-25 09:09:51 【问题描述】:我有一个集合,其中一个字段是“类型”。我想根据所有类型相同的条件获取每种类型的一些值。就像我想要 A 类型的 2 个文档,B 类型的 2 个文档。 如何在单个查询中执行此操作?我正在使用 Ruby Active Record。
【问题讨论】:
【参考方案1】:一般来说,您所描述的是 MongoDB 社区中一个相对常见的问题,我们可以将其描述为“***n
结果问题”。这是当给定一些可能以某种方式排序的输入时,如何在不依赖数据中的任意索引值的情况下获得顶部的n
结果。
MongoDB 有 $first
运算符,aggregation framework 可以使用它处理问题的“前 1”部分,因为这实际上采用了在分组边界上找到的“第一个”项目,例如您的“类型”。但是,获得超过“一个”的结果当然会涉及更多。关于修改其他运算符以处理 n
结果或“限制”或“切片”的一些 JIRA 问题。值得注意的是SERVER-6074。但是这个问题可以通过几种方式来解决。
用于 MongoDB 存储的 Rails Active Record 模式的流行实现是 Mongoid 和 Mongo Mapper,它们都允许通过 .collection
访问器访问“本机”mongodb 集合函数。这就是您基本上需要能够使用原生方法(例如 .aggregate()),它支持比一般 Active Record 聚合更多的功能。
这是一种使用 mongoid 的聚合方法,尽管一旦您可以访问本机集合对象,通用代码就不会改变:
require "mongoid"
require "pp";
Mongoid.configure.connect_to("test");
class Item
include Mongoid::Document
store_in collection: "item"
field :type, type: String
field :pos, type: String
end
Item.collection.drop
Item.collection.insert( :type => "A", :pos => "First" )
Item.collection.insert( :type => "A", :pos => "Second" )
Item.collection.insert( :type => "A", :pos => "Third" )
Item.collection.insert( :type => "A", :pos => "Forth" )
Item.collection.insert( :type => "B", :pos => "First" )
Item.collection.insert( :type => "B", :pos => "Second" )
Item.collection.insert( :type => "B", :pos => "Third" )
Item.collection.insert( :type => "B", :pos => "Forth" )
res = Item.collection.aggregate([
"$group" =>
"_id" => "$type",
"docs" =>
"$push" =>
"pos" => "$pos", "type" => "$type"
,
"one" =>
"$first" =>
"pos" => "$pos", "type" => "$type"
,
"$unwind" => "$docs" ,
"$project" =>
"docs" =>
"pos" => "$docs.pos",
"type" => "$docs.type",
"seen" =>
"$eq" => [ "$one", "$docs" ]
,
,
"one" => 1
,
"$match" =>
"docs.seen" => false
,
"$group" =>
"_id" => "$_id",
"one" => "$first" => "$one" ,
"two" =>
"$first" =>
"pos" => "$docs.pos",
"type" => "$docs.type"
,
"splitter" =>
"$first" =>
"$literal" => ["one","two"]
,
"$unwind" => "$splitter" ,
"$project" =>
"_id" => 0,
"type" =>
"$cond" => [
"$eq" => [ "$splitter", "one" ] ,
"$one.type",
"$two.type"
]
,
"pos" =>
"$cond" => [
"$eq" => [ "$splitter", "one" ] ,
"$one.pos",
"$two.pos"
]
])
pp res
文档中的命名实际上并没有被代码使用,“First”、“Second”等显示的数据中的标题实际上只是为了说明您确实从中获得了“top 2”文档结果是列表。
所以这里的方法本质上是创建一个按您的键“分组”的文档“堆栈”,例如“类型”。这里的第一件事是使用 $first
运算符从该堆栈中取出“第一个”文档。
随后的步骤匹配堆栈中“已见”的元素并过滤它们,然后使用$first
运算符再次将“下一个”文档从堆栈中取出。那里的最后一步实际上只是将文档返回到输入中找到的原始形式,这通常是此类查询所期望的。
所以结果当然是每种类型的前 2 个文档:
"type"=>"A", "pos"=>"First"
"type"=>"A", "pos"=>"Second"
"type"=>"B", "pos"=>"First"
"type"=>"B", "pos"=>"Second"
在最近的回答中,对此以及其他解决方案进行了更长的讨论和版本:
Mongodb aggregation $group, restrict length of array
尽管有标题,但本质上是相同的,并且该案例希望匹配最多 10 个或更多的***条目。那里还有一些管道生成代码,用于处理更大的匹配,以及可能根据您的数据考虑的一些替代方法。
【讨论】:
【参考方案2】:您将无法仅使用类型列和它必须是一个查询的约束直接执行此操作。然而,(一如既往)有一种方法可以做到这一点。
要查找不同类型的文档,您需要有某种类型的附加值,平均而言,根据您希望数据返回的方式分配类型。
db.users.insert(type: 'A', index: 1)
db.users.insert(type: 'B', index: 2)
db.users.insert(type: 'A', index: 3)
db.users.insert(type: 'B', index: 4)
db.users.insert(type: 'A', index: 5)
db.users.insert(type: 'B', index: 6)
那么在查询带有db.users.find(index: $gt: 2, $lt: 7)
的项目时,您将获得正确的项目分布。
虽然我不确定这就是你要找的东西
【讨论】:
以上是关于MongoDB中的多重限制条件的主要内容,如果未能解决你的问题,请参考以下文章
MongoDB 中的复合索引是不是改进了多重匹配(而不是排序)?
由于添加多个条件 GridFSDBFile 查询时 com.mongodb.BasicDBObject 异常的限制
Spring数据mongodb存储库语法中的@Query注释