mongodb查询太大问题

Posted

技术标签:

【中文标题】mongodb查询太大问题【英文标题】:query too large issue with mongodb 【发布时间】:2016-01-29 18:20:48 【问题描述】:

假设我们有一个用户集合,每个用户后面跟着另一个用户。如果我想找到不关注我的用户,我需要执行以下操作:

db.users.find(_id: $nin : follower_ids ) ;

如果followers_ids的数量很大,比如说10万用户,mongodb会开始说查询太大,加上通过网络发送大量数据进行查询也不好。在不通过网络发送所有这些 id 的情况下完成此查询的最佳实践是什么?

【问题讨论】:

【参考方案1】:

我建议您限制查询结果的数量以减少网络需求。根据Docs,

MongoDB 游标以多个文档组的形式返回结果。如果你知道你想要的结果的数量,你可以通过发出limit()方法来减少对网络资源的需求。

这通常与排序操作结合使用。为了 例如,如果您只需要向用户查询 50 个结果 收集,您将发出以下命令:

db.users.find($nin : followers_ids).sort(  timestamp : -1  ).limit(50)

然后您可以根据需要使用光标检索更多用户文档。

建议重组追随者架构

如果关注者会增长到大量,我建议您重新构建用户文档。当前用户架构可能是这样的:


    _id: ObjectId("123"),
    username: "jobs",
    email: "stevej@apple.com",
    followers: [
        ObjectId("12345"),
        ObjectId("12375"),
        ObjectId("12395"),
    ]

架构的好处在于,每当此用户执行任何操作时,您需要通知的所有用户都在文档内部。不利的一面是,如果您需要找到用户关注的每个人,您将不得不查询整个用户集合。此外,随着关注者的增长,您的用户文档将变得更大、更不稳定。

您可能希望进一步规范您的关注者。您可以保留一个将被关注者与关注者匹配的集合,其文档如下所示:


    _id: ObjectId("123"),//Followee's "_id"
    followers: [
        ObjectId("12345"),
        ObjectId("12375"),
        ObjectId("12395"),
    ]

这将使您的用户文档保持纤细,但需要额外的查询才能获得关注者。随着“追随者”数组大小的变化,您可以启用userPowerOf2Sizes 分配策略来减少碎片和移动。

【讨论】:

以上是关于mongodb查询太大问题的主要内容,如果未能解决你的问题,请参考以下文章

mongodb isodate怎么查询

mongodb模糊查询语句用法

求助mongodb 有索引后查询卡死问题

Mongodb:基于 ISODate 格式的时间查询。我的查询有啥问题?

MongoDB安装和使用,MongoDB Like查询,Or查询,分页查询

mongodb 查询子节点