mongodb删除重复数据

Posted 凌馨儿郡主

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了mongodb删除重复数据相关的知识,希望对你有一定的参考价值。

注:mongodb当前版本是3.4.3
 
插入六条数据:

 
查询存在重复的数据:
 
查询并循环删除重复数据:
 
删除语句解析:
db.userInfo.aggregate([
    {
        $group: { _id: {userName: \'$userName\',age: \'$age\'},count: {$sum: 1},dups: {$addToSet: \'$_id\'}}
    },
    {
        $match: {count: {$gt: 1}}
    }
]).forEach(function(doc){
    doc.dups.shift();
    db.userInfo.remove({_id: {$in: doc.dups}});
})
1.根据userName和age分组并统计数量,$group只会返回参与分组的字段,使用$addToSet在返回结果数组中增加_id字段
2.使用$match匹配数量大于1的数据
3.doc.dups.shift();表示从数组第一个值开始删除;作用是踢除重复数据其中一个_id,让后面的删除语句不会删除所有数据
4.使用forEach循环根据_id删除数据
 
$addToSet 操作符只有在值没有存在于数组中时才会向数组中添加一个值。如果值已经存在于数组中,$addToSet返回,不会修改数组。
 
注意:forEach和$addToSet的驼峰写法不能全部写成小写,因为mongodb严格区分大小写mongodb严格区分大小写mongodb严格区分大小写,重要的事情说三遍!
 
参考地址:http://forum.foxera.com/mongodb/topic/967/mongodb%E5%A6%82%E4%BD%95%E5%B0%86%E9%87%8D%E5%A4%8D%E7%9A%84%E6%95%B0%E6%8D%AE%E5%88%A0%E9%99%A4

以上是关于mongodb删除重复数据的主要内容,如果未能解决你的问题,请参考以下文章

mongodb删除重复数据

MongoDB数据重复解决方案

mongodb去重

Python列表问题:只想获取数据并删除字段的标题[重复]

MongoDB:从 Projection 中删除重复记录

映射减少以删除重复项(mongodb)