MongoDB学习笔记

Posted ΘLLΘ

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了MongoDB学习笔记相关的知识,希望对你有一定的参考价值。

文章目录

MongoDB 实战

官方文档地址: https://docs.mongodb.com/manual/

1.简介

1.1 说明

  • 官方

    MongoDB是一个文档数据库,旨在方便应用开发和扩展。

  • 百度百科

    • MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展高性能数据存储解决方案
    • MongoDB是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。他支持的数据结构非常松散,是类似json的bson格式,因此可以存储比较复杂的数据类型 。Mongo最大的特点是他支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对数据建立索引

总结:mongoDB 是一个非关系型文档数据库

1.2 历史

  • 2009年2月,MongoDB数据库首次在数据库领域亮相,打破了关系型数据库一统天下的局面;
  • 2010年8月, MongoDB 1.6发布。这个版本最大的一个功能就是Sharding,自动分片
  • 2014年12月, MongoDB3.0发布。由于收购了WiredTiger 存储引擎,大幅提升了MongoDB的写入性能;
  • 2015年12月,3.2版本发布,开始支持了关系型数据库的核心功能:关联。你可以一次同时查询多个MongoDB的集合。
  • 2016年, MongoDB推出Atlas,在AWS、 Azure 和GCP上的MongoDB托管服务;
  • 2017年10月,MongoDB成功在纳斯达克敲钟,成为26年来第一家以数据库产品为主要业务的上市公司。
  • 2018年6月, MongoDB4.0 发布推出ACID事务支持,成为第一个支持强事务的NoSQL数据库;
  • 2018年–至今,MongoDB已经从一个在数据库领域籍籍无名的“小透明”,变成了话题度和热度都很高的“流量”数据库。

2.特点

2.1 特点

  • 面向集合存储,易存储对象类型的数据
  • 支持查询,以及动态查询
  • 支持RUBY,PYTHON,JAVA,C++,php,C#等多种语言
  • 文件存储格式为BSON(一种JSON的扩展)
  • 支持复制和故障恢复和分片
  • 支持事务支持
  • 索引 聚合 关联…

2.2 应用场景

  • 游戏应用:使用云数据库MongoDB作为游戏服务器的数据库存储用户信息。用户的游戏装备、积分等直接以内嵌文档的形式存储,方便进行查询与更新。
  • 物流应用:使用云数据库MongoDB存储订单信息,订单状态在运送过程中会不断更新,以云数据库MongoDB内嵌数组的形式来存储,一次查询就能将订单所有的变更读取出来,方便快捷且一目了然。
  • 社交应用:使用云数据库MongoDB存储用户信息以及用户发表的朋友圈信息,通过地理位置索引实现附近的人、地点等功能。并且,云数据库MongoDB非常适合用来存储聊天记录,因为它提供了非常丰富的查询,并在写入和读取方面都相对较快。
  • 视频直播:使用云数据库MongoDB存储用户信息、礼物信息等。
  • 大数据应用:使用云数据库MongoDB作为大数据的云存储系统,随时进行数据提取分析,掌握行业动态。

3.安装

3.1 传统方式

# 1.下载 MongoDB
- https://www.mongodb.com/try/download/community
# 2.将下载安装包上传到 linux 系统
- tar -zxf mongodb-linux-aarch64-ubuntu2004-5.0.5.tgz 
# 3.查看安装目录
- ls
	`bin`目录   用来存放启动mongoDB的服务以及客户端链接的脚本文件等

# 4.启动 MongoDB 服务
- ./mongod --port=27017 --dbpath=../data --logpath=../logs/mongo.log
	`--port`    指定服务监听端口号 默认为 27017
	`--dbpath`  指定 mongodb 数据存放目录 启动要求目录必须存在
	`--logpath` 指定 mongodb 日志文件存放位置

注意: 由于指定日志文件因此启动时日志输出到日志中终端不显示任何日志

# 5.客户端连接
- ./mongo --port=27017

3.2 Docker方式

# 1.拉取 mongodb 镜像
- docker pull mongo:5.0.5
# 2.运行 mongo 镜像
- docker run -d --name mongo --p 27017:27017 mongo:5.0.5
# 3.进入 mongo 容器
- docker exec -it bc6c bash

4.核心概念

4.1 库

mongodb中的库就类似于传统关系型数据库中库的概念,用来通过不同库隔离不同应用数据。mongodb中可以建立多个数据库。每一个库都有自己的集合和权限,不同的数据库也放置在不同的文件中。默认的数据库为"test",数据库存储在启动指定的data目录中。

4.2 集合

集合就是 MongoDB 文档组,类似于 RDBMS (关系数据库管理系统:Relational Database Management System)中的表的概念

集合存在于数据库中,一个库中可以创建多个集合。每个集合没有固定的结构,这意味着你在对集合可以插入不同格式和类型的数据,但通常情况下我们插入集合的数据都会有一定的关联性。

4.3 文档

文档集合中一条条记录,是一组键值(key-value)对(即 BSON)。MongoDB 的文档不需要设置相同的字段,并且相同的字段不需要相同的数据类型,这与关系型数据库有很大的区别,也是 MongoDB 非常突出的特点。

一个简单的文档例子如下:

"site":"www.baizhiedu.xin", "name":"编程不良人"

4.4 关系总结

RDBMSMongoDB
数据库数据库
集合
文档
字段

5.基本操作

5.1 库

  • 查看所有库

    > show databases; | show dbs;
    

    注意:

    • admin:从权限的角度来看,这是"root"数据库。要是将一个用户添加到这个数据库,这个用户自动继承所有数据库的权限。一些特定的服务器端命令也只能从这个数据库运行,比如列出所有的数据库或者关闭服务器。
    • local:这个数据永远不会被复制,可以用来存储限于本地单台服务器的任意集合
    • config:当Mongo用于分片设置时,config数据库在内部使用,用于保存分片的相关信息。
  • 创建数据库

    > use 库名
    

    注意: use 代表创建并使用,当库中没有数据时默认不显示这个库

  • 删除数据库

    默认删除当前选中的库

    > db.dropDatabase()
    
  • 查看当前所在库

    > db;
    

5.2 集合

  • 查看库中所有集合

    > show collections; | show tables;
    
  • 创建集合

    > db.createCollection('集合名称', [options])
    

    options可以是如下参数:

    字段类型描述
    capped布尔(可选)如果为 true,则创建固定集合。固定集合是指有着固定大小的集合,当达到最大值时,它会自动覆盖最早的文档。 当该值为 true 时,必须指定 size 参数。
    size数值(可选)为固定集合指定一个最大值,即字节数。 如果 capped 为 true,也需要指定该字段。
    max数值(可选)指定固定集合中包含文档的最大数量。

注意:当集合不存在时,向集合中插入文档也会自动创建该集合。

  • 删除集合

    > db.集合名称.drop();
    

5.3 文档

参考文档: https://docs.mongodb.com/manual/reference/method/

  • 插入文档

    • 单条文档

      > db.集合名称.insert("name":"编程不良人","age":23,"bir":"2012-12-12");
      
    • 多条文档

      > db.集合名称.insertMany(
         [ <document 1> , <document 2>, ... ],
         
       			writeConcern: 1,//写入策略,默认为 1,即要求确认写操作,0 是不要求。
            		ordered: true //指定是否按顺序写入,默认 true,按顺序写入。
         
      )
      > db.集合名称.insert([
        	"name":"不良人","age":23,"bir":"2012-12-12",
        	"name":"小黑","age":25,"bir":"2012-12-12"
      ]);
      
    • 脚本方式

      for(let i=0;i<100;i++)
          db.users.insert("_id":i,"name":"编程不良人_"+i,"age":23);
      
      

    注意:在 mongodb 中每个文档都会有一个_id作为唯一标识,_id默认会自动生成如果手动指定将使用手动指定的值作为_id 的值。

  • 查询所有

    > db.集合名称.find();
    
  • 删除文档

    db.集合名称.remove(
       <query>,
       
         justOne: <boolean>,
         writeConcern: <document>
       
    )
    

    参数说明:

    • query:可选删除的文档的条件。
    • justOne可选如果设为 true 或 1,则只删除一个文档,如果不设置该参数,或使用默认值 false,则删除所有匹配条件的文档。
    • writeConcern可选抛出异常的级别。
  • 更新文档

    db.集合名称.update(
       <query>,
       <update>,
       
         upsert: <boolean>,
         multi: <boolean>,
         writeConcern: <document>
       
    );
    

    参数说明:

    • query:update的查询条件,类似sql update查询内where后面的。
    • update:update的对象和一些更新的操作符(如 , , ,inc…)等,也可以理解为sql update查询内set后面的
    • upsert可选,这个参数的意思是,如果不存在update的记录,是否插入objNew,true为插入,默认是false,不插入。
    • multi可选,mongodb 默认是false,只更新找到的第一条记录,如果这个参数为true,就把按条件查出来多条记录全部更新。
    • writeConcern可选,抛出异常的级别。
    - db.集合名称.update("name":"zhangsan",name:"11",bir:new date()) 
    	`这个更新是将符合条件的全部更新成后面的文档,相当于先删除在更新`
    - db.集合名称.update("name":"xiaohei",$set:name:"mingming")
    	`保留原来数据更新,但是只更新符合条件的第一条数据`
    - db.集合名称.update(name:”小黑”,$set:name:”小明”,multi:true)		
    	`保留原来数据更新,更新符合条件的所有数据`
    - db.集合名称.update(name:”小黑”,$set:name:”小明”,multi:true,upsert:true)
    	`保留原来数据更新,更新符合条件的所有数据 没有条件符合时插入数据
    

6.文档查询

MongoDB 查询文档使用 find() 方法。find() 方法以非结构化的方式来显示所有文档。

6.1 语法

> db.集合名称.find(query, projection)
  • query:可选,使用查询操作符指定查询条件
  • projection:可选,使用投影操作符指定返回的键。查询时返回文档中所有键值, 只需省略该参数即可(默认省略)。

如果你需要以易读的方式来读取数据,可以使用 pretty() 方法,语法格式如下:

> db.集合名称.find().pretty()

注意: pretty() 方法以格式化的方式来显示所有文档。

6.2 对比语法

如果你熟悉常规的 SQL 数据,通过下表可以更好的理解 MongoDB 的条件语句查询:

6.3 AND

> db.集合名称.find(key1:value1, key2:value2,...).pretty()

类似于 WHERE 语句:WHERE key1=value1 AND key2=value2

6.4 OR

MongoDB OR 条件语句使用了关键字 $or,语法格式如下:

> db.集合名称.find(
   
      $or: [
         key1: value1, key2:value2
      ]
   
).pretty()

类似于 WHERE 语句:WHERE key1=value1 or key2=value2

6.5 AND 和 OR 联合

类似SQL语句为:'where age >50 AND (name = '编程不良人' OR name = 'MongoDB')'

> db.集合名称.find("age": $gt:50, $or: ["name": "编程不良人","name": "MongoDB"]).pretty();

6.6 数组中查询

-- 测试数据
> db.集合名称.insert( "_id" : 11, "age" : 29, "likes" : [ "看电视", "读书xx", "美女" ], "name" : "不良人_xx_11" )
-- 执行数组查询
> db.users.find(likes:"看电视")
-- $size 按照数组长度查询
> db.users.find(likes:$size:3);

6.7 模糊查询

类似 SQL 中为 'where name like '%name%''

> db.users.find(likes://);

注意:在 mongoDB 中使用正则表达式可以是实现近似模糊查询功能

6.8 排序

> db.集合名称.find().sort(name:1,age:1),
- 1 升序  -1 降序

类似 SQL 语句为: 'order by name,age'

6.9 分页

> db.集合名称.find().sort(条件).skip(start).limit(rows);

类似于 SQL 语句为: 'limit start,rows'

6.10 总条数

> db.集合名称.count();
> db.集合名称.find("name":"编程不良人").count();

类似于 SQL 语句为: 'select count(id) from ....'

6.11 去重

> db.集合名称.distinct('字段')

类似于 SQL 语句为: 'select distinct name from ....'

6.12 指定返回字段

> db.集合名称.find(条件,name:1,age:1) 
- 参数2: 1 返回  0 不返回    `注意:1和0不能同时使用`

7.$type

7.1 说明

$type操作符是基于BSON类型来检索集合中匹配的数据类型,并返回结果。

MongoDB 中可以使用的类型如下表所示:

7.2 使用

> db.col.insert(
    title: 'PHP 教程', 
    description: 'PHP 是一种创建动态交互性站点的强有力的服务器端脚本语言。',
    by: '编程不良人',
    url: 'http://www.baizhiedu.xin',
    tags: ['php'],
    likes: 200
);

> db.col.insert(
    title: 'Java 教程', 
    description: 'Java 是由Sun Microsystems公司于1995年5月推出的高级程序设计语言。',
    by: '编程不良人',
    url: 'http://www.baizhiedu.xin',
    tags: ['java'],
    likes: 550
);

> db.col.insert(
    title: 'MongoDB 教程', 
    description: 'MongoDB 是一个 Nosql 数据库',
    by: '编程不良人',
    url: 'http://www.baizhiedu.xin',
    tags: ['mongodb'],
    likes: 100
);

> db.col.insert(
    title: 2233, 
    description: '2233 是一个 B站的',
    by: '编程不良人',
    url: 'http://www.baizhiedu.xin',
    tags: ['2233'],
    likes: 100
);

如果想获取 “col” 集合中 title 为 String 的数据,你可以使用以下命令:

db.col.find("title" : $type : 2).pretty();
或
db.col.find("title" : $type : 'string').pretty();

如果想获取 “col” 集合中 tags 为 Array 的数据,你可以使用以下命令:

dge
或
db.col.find("tags" : $type : 'array').pretty();

8.索引

官方文档:https://docs.mongodb.com/manual/indexes/

8.1 说明

索引通常能够极大的提高查询的效率,如果没有索引,MongoDB在读取数据时必须扫描集合中的每个文件并选取那些符合查询条件的记录。这种扫描全集合的查询效率是非常低的,特别在处理大量的数据时,查询可以要花费几十秒甚至几分钟,这对网站的性能是非常致命的。索引是特殊的数据结构,索引存储在一个易于遍历读取的数据集合中,索引是对数据库表中一列或多列的值进行排序的一种结构。

8.2 原理

从根本上说,MongoDB中的索引与其他数据库系统中的索引类似。MongoDB在集合层面上定义了索引,并支持对MongoDB集合中的任何字段或文档的子字段进行索引。

8.3 操作

0、创建索引

> db.集合名称.createIndex(keys, options)
> db.集合名称.createIndex("title":1,"description":-1)

说明: 语法中 Key 值为你要创建的索引字段,1 为指定按升序创建索引,如果你想按降序来创建索引指定为 -1 即可。

createIndex() 接收可选参数,可选参数列表如下:

ParameterTypeDescription
backgroundBoolean建索引过程会阻塞其它数据库操作,background可指定以后台方式创建索引,即增加 “background” 可选参数。 “background” 默认值为false
uniqueBoolean建立的索引是否唯一。指定为true创建唯一索引。默认值为false.
namestring索引的名称。如果未指定,MongoDB的通过连接索引的字段名和排序顺序生成一个索引名称。
sparseBoolean对文档中不存在的字段数据不启用索引;这个参数需要特别注意,如果设置为true的话,在索引字段中不会查询出不包含对应字段的文档.。默认值为 false.
expireAfterSecondsinteger指定一个以秒为单位的数值,完成 TTL设定,设定集合的生存时间。
vindex version索引的版本号。默认的索引版本取决于mongod创建索引时运行的版本。
weightsdocument索引权重值,数值在 1 到 99,999 之间,表示该索引相对于其他索引字段的得分权重。
default_languagestring对于文本索引,该参数决定了停用词及词干和词器的规则的列表。 默认为英语
language_overridestring对于文本索引,该参数指定了包含在文档中的字段名,语言覆盖默认的language,默认值为 language.

1、查看集合索引

> db.集合名称.getIndexes()

2、查看集合索引大小

> db.集合名称.totalIndexSize()

3、删除集合所有索引

> db.集合名称.dropIndexes()

4、删除集合指定索引

> db.集合名称.dropIndex("索引名称")

8.4 复合索引

​ 说明: 一个索引的值是由多个 key 进行维护的索引的称之为复合索引

> db.集合名称.createIndex("title":1,"description":-1)

注意: mongoDB 中复合索引和传统关系型数据库一致都是左前缀原则

9.聚合

9.1 说明

MongoDB 中聚合(aggregate)主要用于处理数据(诸如统计平均值,求和等),并返回计算后的数据结果。有点类似 SQL 语句中的 count(*)

9.2 使用


   title: 'MongoDB Overview', 
   description: 'MongoDB is no sql database',
   by_user: 'runoob.com',
   url: 'http://www.runoob.com',
   tags: ['mongodb', 'database', 'NoSQL'],
   likes: 100
,

   title: 'NoSQL Overview', 
   description: 'No sql database is very fast',
   by_user: 'runoob.com',
   url: 'http://www.runoob.com',
   tags: ['mongodb', 'database', 'NoSQL'],
   likes: 10
,

   title: 'Neo4j Overview', 
   description: 'Neo4j is no sql database',
   by_user: 'Neo4j',
   url: 'http://www.neo4j.com',
   tags: ['neo4j', 'database', 'NoSQL'],
   likes: 750

现在我们通过以上集合计算每个作者所写的文章数,使用aggregate()计算结果如下:

> db.集合名称.aggregate([$group : _id : "$by_user", num_tutorial : $sum : 1])

9.3 常见聚合表达式

10.整合应用

说明: 这里主要以 springboot 应用为基础应用进行整合开发。

Spring Data : Spring 数据框架 JPA 、Redis、Elasticsearch、AMQP、MongoDB

JdbcTemplate

RedisTemplate

ElasticTempalte

AmqpTemplate

MongoTemplate

SpringBoot Spring Data MongoDB

10.1 环境搭建

# 引入依赖
<dependency>
  <groupId>org.springframework.boot</groupId>
  <artifactId>spring-boot-starter-data-mongodb</artifactId>
</dependency>
# 编写配置
# mongodb 没有开启任何安全协议
# mongodb(协议)://121.5.167.13(主机):27017(端口)/baizhi(库名)
spring.data.mongodb.uri=mongodb://121.5.167.13:27017/baizhi


# mongodb 存在密码
#spring.data.mongodb.host=tx.chenyn.cn
#spring.data.mongodb.port=27017
#spring.data.mongodb.database=baizhi
#spring.data.mongodb.username=root
#spring.data.mongodb.password=root

10.2 集合操作

  • 创建集合

    @Test
    public void testCreateCollection()
      mongoTemplate.createCollection("users");//参数: 创建集合名称
    
    

    注意:创建集合不能存在,存在报错

  • 删除集合

    @Test
    public void testDeleteCollection()
      mongoTemplate.dropCollection("users");
    
    

10.3 相关注解

  • @Document
    • 修饰范围:用在类上
    • 作用:用来映射这个类的一个对象为 mongo 中一条文档数据
    • 属性:(value 、collection )用来指定操作的集合名称
  • @Id
    • 修饰范围:用在成员变量、方法上
    • 作用:用来将成员变量的值映射为文档的_id 的值
  • @Field
    • 修饰范围:用在成员变量、方法上
    • 作用:用来将成员变量以及值映射为文档中一个key、value对
    • 属性:( name,value )用来指定在文档中 key 的名称,默认为成员变量名
  • @Transient
    • 修饰范围:用在成员变量、方法上
    • 作用:用来指定改成员变量,不参与文档的序列化

10.4 文档操作