MongoDB常见操作及集群搭建

Posted 2021-05-01 Java面试那些事儿

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了MongoDB常见操作及集群搭建相关的知识，希望对你有一定的参考价值。

本文阅读大概需要13分钟。

简介

MongoDB是一个基于分布式文件存储的数据库。由C++语言编写；旨在为WEB应用提供可扩展的高性能数据存储解决方案。

特点

高性能、易部署、易使用，存储数据非常方便。

功能特性

面向集合存储，易存储对象类型的数据
模式自由
支持动态查询
支持完全索引，包含内部对象
支持查询
支持复制和故障恢复
使用高效的二进制数据存储，包括大型对象（如视频等）
自动处理碎片，以支持云计算层次的扩展性
支持RUBY，PYTHON，JAVA，C++，php等多种语言
文件存储格式为BSON（一种JSON的扩展）
可通过网络访问

基本操作

安装

 
   
   
 
  
    
    
  curl -O https://fastdl.mongodb.org/linux/mongodb-linux-x86_64-3.0.6.tgz
  
    
    
  tar -zxvf mongodb-linux-x86_64-3.0.6.tgz                               
  
    
    
  mv  mongodb-linux-x86_64-3.0.6/ /usr/local/mongodb

添加到 PATH 路径中：

 
   
   
 
  
    
    
  export PATH=/usr/local/mongodb/bin:$PATH

参数说明

基本配置

 
   
   
 
  
    
    
  --quiet     # 安静输出
  
    
    
  --port arg     # 指定服务端口号，默认端口27017
  
    
    
  --bind_ip arg     # 绑定服务IP，若绑定127.0.0.1，则只能本机访问，不指定默认本地所有IP
  
    
    
  --logpath arg     # 指定MongoDB日志文件，注意是指定文件不是目录
  
    
    
  --logappend     # 使用追加的方式写日志
  
    
    
  --pidfilepath arg     # PID File 的完整路径，如果没有设置，则没有PID文件
  
    
    
  --keyFile arg     # 集群的私钥的完整路径，只对于Replica Set 架构有效
  
    
    
  --unixSocketPrefix arg     # UNIX域套接字替代目录,(默认为 /tmp)
  
    
    
  --fork     # 以守护进程的方式运行MongoDB，创建服务器进程
  
    
    
  --auth     # 启用验证
  
    
    
  --cpu     # 定期显示CPU的CPU利用率和iowait
  
    
    
  --dbpath arg     # 指定数据库路径
  
    
    
  --diaglog arg     # diaglog选项 0=off 1=W 2=R 3=both 7=W+some reads
  
    
    
  --directoryperdb     # 设置每个数据库将被保存在一个单独的目录
  
    
    
  --journal     # 启用日志选项，MongoDB的数据操作将会写入到journal文件夹的文件里
  
    
    
  --journalOptions arg     # 启用日志诊断选项
  
    
    
  --ipv6     # 启用IPv6选项
  
    
    
  --jsonp     # 允许JSONP形式通过HTTP访问（有安全影响）
  
    
    
  --maxConns arg     # 最大同时连接数 默认2000
  
    
    
  --noauth     # 不启用验证
  
    
    
  --nohttpinterface     # 关闭http接口，默认关闭27018端口访问
  
    
    
  --noprealloc     # 禁用数据文件预分配(往往影响性能)
  
    
    
  --noscripting     # 禁用脚本引擎
  
    
    
  --notablescan     # 不允许表扫描
  
    
    
  --nounixsocket     # 禁用Unix套接字监听
  
    
    
  --nssize arg (=16)     # 设置信数据库.ns文件大小(MB)
  
    
    
  --objcheck     # 在收到客户数据,检查的有效性，
  
    
    
  --profile arg     # 档案参数 0=off 1=slow, 2=all
  
    
    
  --quota     # 限制每个数据库的文件数，设置默认为8
  
    
    
  --quotaFiles arg     # number of files allower per db, requires --quota
  
    
    
  --rest     # 开启简单的rest API
  
    
    
  --repair     # 修复所有数据库run repair on all dbs
  
    
    
  --repairpath arg     # 修复库生成的文件的目录,默认为目录名称dbpath
  
    
    
  --slowms arg (=100)     # value of slow for profile and console log
  
    
    
  --smallfiles     # 使用较小的默认文件
  
    
    
  --syncdelay arg (=60)     # 数据写入磁盘的时间秒数(0=never,不推荐)
  
    
    
  --sysinfo     # 打印一些诊断系统信息
  
    
    
  --upgrade     # 如果需要升级数据库

Replicaton 参数

 
   
   
 
  
    
    
  --fastsync     # 从一个dbpath里启用从库复制服务，该dbpath的数据库是主库的快照，可用于快速启用同步
  
    
    
  --autoresync     # 如果从库与主库同步数据差得多，自动重新同步，
  
    
    
  --oplogSize arg     # 设置oplog的大小(MB)

主/从参数

 
   
   
 
  
    
    
  --master     # 主库模式
  
    
    
  --slave     # 从库模式
  
    
    
  --source arg     # 从库 端口号
  
    
    
  --only arg     # 指定单一的数据库复制
  
    
    
  --slavedelay arg     # 设置从库同步主库的延迟时间

Replica set(副本集)选项

 
   
   
 
  
    
    
  --replSet arg     # 设置副本集名称 
  
    
    
  
  
    
    
  Sharding(分片)选项
  
    
    
  --configsvr     # 声明这是一个集群的config服务,默认端口27019，默认目录/data/configdb
  
    
    
  --shardsvr     # 声明这是一个集群的分片,默认端口27018
  
    
    
  --noMoveParanoia     # 关闭偏执为moveChunk数据保存

上述参数都可以写入 mongod.conf 配置文档里例如：

 
   
   
 
  
    
    
  dbpath = /data/mongodb
  
    
    
  logpath = /data/mongodb/mongodb.log
  
    
    
  logappend = true
  
    
    
  port = 27017
  
    
    
  fork = true
  
    
    
  auth = true

启动方式

命令行

 
   
   
 
  
    
    
  mongod --dbpath /data/mongodbtest/single/data/

配置文件

 
   
   
 
  
    
    
  mongod -f mongodb.conf

说明：这两种方式都是前台启动mongodb进程，如果session窗口关闭，则mongodb进程也随之关闭。而mongdb还有一种后台Daemon方式启动，只需要添加"--fork"参数即可。值得注意的是，用到了"--fork"参数就必须启用"--logpath"参数。

 
   
   
 
  
    
    
  mongod --dbpath=/data/mongodbtest/single/data --fork --logpath=/data/mongodbtest/single/mongodb.log

MongoDB常见操作及集群搭建

daemon方式启动的fork参数也可以配置配置文件mongodb.conf中，内容如下所示:

 
   
   
 
  
    
    
  port=27017  
  
    
    
  dbpath=/data/mongodbtest/single/
  
    
    
  logpath=/data/mongodbtest/single/mongodb.log  
  
    
    
  logappend=true  
  
    
    
  fork=true

关闭

在后台运行，如果想要关闭它的话，需要给他发送shutdownServer()。

MongoDB常见操作及集群搭建

搭建

单实例模式

说明：这种配置只是适合开发，生产不适用，因为单个节点挂掉，整个业务中断。

MongoDB常见操作及集群搭建

建立mongodb测试文件夹

 
   
   
 
  
    
    
  #存放整个mongodb文件  
  
    
    
  mkdir -p /data/mongodbtest/single  
  
    
    
  #存放mongodb数据文件  
  
    
    
  mkdir -p /data/mongodbtest/single/data  
  
    
    
  
  
    
    
  #进入mongodb文件夹  
  
    
    
  cd  /data/mongodbtest/single

启动单实例

 
   
   
 
  
    
    
  mongod  --dbpath /data/mongodbtest/single/data --fork --logpath=/data/mongodbtest/single/mongodb.log

MongoDB常见操作及集群搭建

mongodb默认自带了web访问接口:http://192.168.1.103:28017

MongoDB常见操作及集群搭建

副本集模式

说明：mongodb官方已经不建议使用主从模式，替换方案采用副本集模式。

主从模式其实就是一个单副本的应用，没有很好的扩展性和容错性。而副本集具有多个副本保证了容错性，就算一个副本挂掉了还有很多副本存在，并且解决了上面第一个问题“主节点挂掉了，整个集群内会自动切换”。

mongodb副本集的设计图：

MongoDB常见操作及集群搭建

由图可以看到客户端连接到整个副本集，不关心具体哪一台机器是否挂掉。主服务器负责整个副本集的读写，副本集定期同步数据备份，一但主节点挂掉，副本节点就会选举一个新的主服务器，这一切对于应用服务器不需要关心。

我们看一下主服务器挂掉后的设计图：

MongoDB常见操作及集群搭建

配置步骤

准备三台机子：192.168.1.103 192.168.1.131 192.168.1.140

其中192.168.1.103作为主节点 192.168.1.131 192.168.1.140作为副本节点。

分别在每台机子建立mongodb的文件夹

 
   
   
 
  
    
    
  #存放整个mongodb文件
  
    
    
  mkdir -p /data/mongodb/replset 
  
    
    
  #存放mongodb数据文件
  
    
    
  mkdir -p /data/mongodb/replset/data

在每台机器上启动mongodb

命令行启动

 
   
   
 
  
    
    
  mongod --dbpath /data/mongodb/replset/data --replSet repset --fork --logpath=/data/mongodb/mongodb.log

配置文件mongodb.conf启动

 
   
   
 
  
    
    
  dbpath=/data/mongodb/replset/data
  
    
    
  logpath=/data/mongodb/mongodb.log  
  
    
    
  logappend=true  
  
    
    
  fork=true
  
    
    
  journal=true
  
    
    
  oplogSize=2048
  
    
    
  smallfiles=true
  
    
    
  replSet=repset

启动命令：mongod -f mongodb.conf

MongoDB常见操作及集群搭建

初始化副本集

在三台机器上任意一台机器登陆mongodb；打开mongo终端。

 
   
   
 
  
    
    
  use admin
  
    
    
  config = { _id:"repset",members:[{_id:0,host:"192.168.1.103:27017"},{_id:1,host:"192.168.1.131:27017"},{_id:2,host:"192.168.1.140:27017"}]}
  
    
    
  rs.initiate(config);
  
    
    
  rs.status(); #查看集群节点的状态

结果说明

"health" : 1, #代表机器正常 "stteStr" : "PRIMARY", #代表是主节点，可读写，其中有以下几下状态:

 
   
   
 
  
    
    
  STARTUP：刚加入到复制集中，配置还未加载
  
    
    
  STARTUP2：配置已加载完，初始化状态
  
    
    
  RECOVERING：正在恢复，不适用读
  
    
    
  ARBITER: 仲裁者
  
    
    
  DOWN：节点不可到达
  
    
    
  UNKNOWN：未获取其他节点状态而不知是什么状态，一般发生在只有两个成员的架构，脑裂
  
    
    
  REMOVED：移除复制集
  
    
    
  ROLLBACK：数据回滚，在回滚结束时，转移到RECOVERING或SECONDARY状态
  
    
    
  FATAL：出错。查看日志grep “replSet FATAL”找出错原因，重新做同步
  
    
    
  PRIMARY：主节点
  
    
    
  SECONDARY：备份节点

MongoDB常见操作及集群搭建

测试副本集数据复制功能

在主节点192.168.1.131 上连接到终端：

 
   
   
 
  
    
    
  mongo 127.0.0.1

建立test 数据库

往testdb表插入数据

 
   
   
 
  
    
    
  db.testdb.insert({"name":"zhangsan"})

MongoDB常见操作及集群搭建

在副本节点 192.168.1.103、192.168.1.140 上连接到mongodb查看数据是否复制过来。

 
   
   
 
  
    
    
  mongo 192.168.1.103:27017

使用test 数据库。

 
   
   
 
  
    
    
  repset:SECONDARY> use test;
  
    
    
  repset:SECONDARY> show tables;

mongodb默认是从主节点读写数据的，副本节点上不允许读，需要设置副本节点可以读。

 
   
   
 
  
    
    
  repset:SECONDARY> db.getMongo().setSlaveOk();

可以看到数据已经复制到了副本集。

 
   
   
 
  
    
    
  repset:SECONDARY> db.testdb.find();

MongoDB常见操作及集群搭建

测试副本集故障转移功能

先停掉主节点131，查看103、140的选票结果。

MongoDB常见操作及集群搭建

在140节点查看

MongoDB常见操作及集群搭建

再重新启动节点131

END

以上是关于MongoDB常见操作及集群搭建的主要内容，如果未能解决你的问题，请参考以下文章

swarm集群搭建及常见操作

Docker——基于Docker搭建MongoDB分片集群

DataBase MongoDB集群方案介绍及搭建

MongoDB分片集群搭建及扩容

MongoDB分片集群原理搭建及测试详解

MongoDB 集群搭建（主从复制副本及）