搭建 MongoDB分片(sharding) / 分区 / 集群环境

Posted 搜云库技术团队

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了搭建 MongoDB分片(sharding) / 分区 / 集群环境相关的知识,希望对你有一定的参考价值。

1. 安装 MongoDB

三台机器

关闭防火墙

 
   
   
 
  1. systemctl stop firewalld.service

192.168.252.121 192.168.252.122 192.168.252.123
mongos mongos mongos
config server config server config server
shard server1 主节点 shard server1 副节点 shard server1 仲裁
shard server2 仲裁 shard server2 主节点 shard server2 副节点
shard server3 副节点 shard server3 仲裁 shard server3 主节点

端口分配:

 
   
   
 
  1. mongos20000

  2. config21000

  3. shard127001

  4. shard227002

  5. shard327003

下载并且安装

 
   
   
 
  1. wget https://fastdl.mongodb.org/linux/mongodb-linux-x86_64-amazon-3.6.2.tgz

  2. tar -xzvf mongodb-linux-x86_64-amazon-3.6.2.tgz  -C /usr/local/

所有版本二进制文件,自行下载

 
   
   
 
  1. https://www.mongodb.org/dl/win32/x86_64-2008plus-ssl?_ga=2.87139544.1567998244.1517190032-1153843332.1517190032&_gac=1.204211492.1517212002.EAIaIQobChMI44v9_9b82AIV1AcqCh0lcABIEAAYASAAEgKI1_D_BwE

改名

 
   
   
 
  1. cd /usr/local/

  2. mv  mongodb-linux-x86_64-amazon-3.6.2 mongodb

分别在每台机器建立conf、mongos、config、shard1、shard2、shard3六个目录,因为mongos不存储数据,只需要建立日志文件目录即可。

 
   
   
 
  1. mkdir -p /usr/local/mongodb/conf \

  2. mkdir -p /usr/local/mongodb/mongos/log \

  3. mkdir -p /usr/local/mongodb/config/data \

  4. mkdir -p /usr/local/mongodb/config/log \

  5. mkdir -p /usr/local/mongodb/shard1/data \

  6. mkdir -p /usr/local/mongodb/shard1/log \

  7. mkdir -p /usr/local/mongodb/shard2/data \

  8. mkdir -p /usr/local/mongodb/shard2/log \

  9. mkdir -p /usr/local/mongodb/shard3/data \

  10. mkdir -p /usr/local/mongodb/shard3/log

配置环境变量

 
   
   
 
  1. vi /etc/profile

  2. # MongoDB 环境变量内容

  3. export MONGODB_HOME=/usr/local/mongodb

  4. export PATH=$MONGODB_HOME/bin:$PATH

使立即生效

 
   
   
 
  1. source /etc/profile

2. config server配置服务器

mongodb3.4以后要求配置服务器也创建副本集,不然集群搭建不成功。

(三台机器)添加配置文件

 
   
   
 
  1. vi /usr/local/mongodb/conf/config.conf

  2. ## 配置文件内容

  3. pidfilepath = /usr/local/mongodb/config/log/configsrv.pid

  4. dbpath = /usr/local/mongodb/config/data

  5. logpath = /usr/local/mongodb/config/log/congigsrv.log

  6. logappend = true

  7. bind_ip = 0.0.0.0

  8. port = 21000

  9. fork = true

  10. #declare this is a config db of a cluster;

  11. configsvr = true

  12. #副本集名称

  13. replSet = configs

  14. #设置最大连接数

  15. maxConns = 20000

启动三台服务器的config server

 
   
   
 
  1. mongod -f /usr/local/mongodb/conf/config.conf

登录任意一台配置服务器,初始化配置副本集

连接 MongoDB

 
   
   
 
  1. mongo --port 21000

config 变量

 
   
   
 
  1. config = {

  2.    _id : "configs",

  3.    members : [

  4.    {_id : 0, host : "192.168.252.121:21000" },

  5.    {_id : 1, host : "192.168.252.122:21000" },

  6.    {_id : 2, host : "192.168.252.123:21000" }

  7.    ]

  8. }

初始化副本集

 
   
   
 
  1. rs.initiate(config)

其中,"_id" : "configs"应与配置文件中配置的 replicaction.replSetName 一致,"members" 中的 "host" 为三个节点的 ip 和 port

响应内容如下

 
   
   
 
  1. > config = {

  2. ... _id : "configs",

  3. ... members : [

  4. ... {_id : 0, host : "192.168.252.121:21000" },

  5. ... {_id : 1, host : "192.168.252.122:21000" },

  6. ... {_id : 2, host : "192.168.252.123:21000" }

  7. ... ]

  8. ... }

  9. {

  10.    "_id" : "configs",

  11.    "members" : [

  12.        {

  13.            "_id" : 0,

  14.            "host" : "192.168.252.121:21000"

  15.        },

  16.        {

  17.            "_id" : 1,

  18.            "host" : "192.168.252.122:21000"

  19.        },

  20.        {

  21.            "_id" : 2,

  22.            "host" : "192.168.252.123:21000"

  23.        }

  24.    ]

  25. }

  26. > rs.initiate(config);

  27. {

  28.    "ok" : 1,

  29.    "operationTime" : Timestamp(1517369899, 1),

  30.    "$gleStats" : {

  31.        "lastOpTime" : Timestamp(1517369899, 1),

  32.        "electionId" : ObjectId("000000000000000000000000")

  33.    },

  34.    "$clusterTime" : {

  35.        "clusterTime" : Timestamp(1517369899, 1),

  36.        "signature" : {

  37.            "hash" : BinData(0,"AAAAAAAAAAAAAAAAAAAAAAAAAAA="),

  38.            "keyId" : NumberLong(0)

  39.        }

  40.    }

  41. }

  42. configs:SECONDARY>

此时会发现终端上的输出已经有了变化。

 
   
   
 
  1. //从单个一个

  2. >

  3. //变成了

  4. configs:SECONDARY>

查询状态

 
   
   
 
  1. configs:SECONDARY> rs.status()

3. 配置分片副本集

3.1 设置第一个分片副本集

(三台机器)设置第一个分片副本集

配置文件

 
   
   
 
  1. vi /usr/local/mongodb/conf/shard1.conf

  2. #配置文件内容

  3. #——————————————–

  4. pidfilepath = /usr/local/mongodb/shard1/log/shard1.pid

  5. dbpath = /usr/local/mongodb/shard1/data

  6. logpath = /usr/local/mongodb/shard1/log/shard1.log

  7. logappend = true

  8. bind_ip = 0.0.0.0

  9. port = 27001

  10. fork = true

  11. #副本集名称

  12. replSet = shard1

  13. #declare this is a shard db of a cluster;

  14. shardsvr = true

  15. #设置最大连接数

  16. maxConns = 20000

启动三台服务器的shard1 server

 
   
   
 
  1. mongod -f /usr/local/mongodb/conf/shard1.conf

登陆任意一台服务器,初始化副本集(除了192.168.252.123)

连接 MongoDB

 
   
   
 
  1. mongo --port 27001

使用admin数据库

 
   
   
 
  1. use admin

定义副本集配置

 
   
   
 
  1. config = {

  2.    _id : "shard1",

  3.     members : [

  4.         {_id : 0, host : "192.168.252.121:27001" },

  5.         {_id : 1, host : "192.168.252.122:27001" },

  6.         {_id : 2, host : "192.168.252.123:27001" , arbiterOnly: true }

  7.     ]

  8. }

初始化副本集配置

 
   
   
 
  1. rs.initiate(config)

响应内容如下

 
   
   
 
  1. > use admin

  2. switched to db admin

  3. > config = {

  4. ...     _id : "shard1",

  5. ...      members : [

  6. ...          {_id : 0, host : "192.168.252.121:27001" },

  7. ...          {_id : 1, host : "192.168.252.122:27001" },

  8. ...          {_id : 2, host : "192.168.252.123:27001" , arbiterOnly: true }

  9. ...      ]

  10. ...  }

  11. {

  12.    "_id" : "shard1",

  13.    "members" : [

  14.        {

  15.            "_id" : 0,

  16.            "host" : "192.168.252.121:27001"

  17.        },

  18.        {

  19.            "_id" : 1,

  20.            "host" : "192.168.252.122:27001"

  21.        },

  22.        {

  23.            "_id" : 2,

  24.            "host" : "192.168.252.123:27001",

  25.            "arbiterOnly" : true

  26.        }

  27.    ]

  28. }

  29. > rs.initiate(config)

  30. { "ok" : 1 }

此时会发现终端上的输出已经有了变化。

 
   
   
 
  1. //从单个一个

  2. >

  3. //变成了

  4. shard1:SECONDARY>

查询状态

 
   
   
 
  1. shard1:SECONDARY> rs.status()

3.2 设置第二个分片副本集

设置第二个分片副本集

配置文件

 
   
   
 
  1. vi /usr/local/mongodb/conf/shard2.conf

  2. #配置文件内容

  3. #——————————————–

  4. pidfilepath = /usr/local/mongodb/shard2/log/shard2.pid

  5. dbpath = /usr/local/mongodb/shard2/data

  6. logpath = /usr/local/mongodb/shard2/log/shard2.log

  7. logappend = true

  8. bind_ip = 0.0.0.0

  9. port = 27002

  10. fork = true

  11. #副本集名称

  12. replSet=shard2

  13. #declare this is a shard db of a cluster;

  14. shardsvr = true

  15. #设置最大连接数

  16. maxConns=20000

启动三台服务器的shard2 server

 
   
   
 
  1. mongod -f /usr/local/mongodb/conf/shard2.conf

连接 MongoDB

 
   
   
 
  1. mongo --port 27002

使用admin数据库

 
   
   
 
  1. use admin

定义副本集配置

 
   
   
 
  1. config = {

  2.    _id : "shard2",

  3.     members : [

  4.         {_id : 0, host : "192.168.252.121:27002"  , arbiterOnly: true },

  5.         {_id : 1, host : "192.168.252.122:27002" },

  6.         {_id : 2, host : "192.168.252.123:27002" }

  7.     ]

  8. }

初始化副本集配置

 
   
   
 
  1. rs.initiate(config)

响应内容如下

 
   
   
 
  1. > use admin

  2. switched to db admin

  3. > config = {

  4. ...     _id : "shard2",

  5. ...      members : [

  6. ...          {_id : 0, host : "192.168.252.121:27002"  , arbiterOnly: true },

  7. ...          {_id : 1, host : "192.168.252.122:27002" },

  8. ...          {_id : 2, host : "192.168.252.123:27002" }

  9. ...      ]

  10. ...  }

  11. {

  12.    "_id" : "shard2",

  13.    "members" : [

  14.        {

  15.            "_id" : 0,

  16.            "host" : "192.168.252.121:27002",

  17.            "arbiterOnly" : true

  18.        },

  19.        {

  20.            "_id" : 1,

  21.            "host" : "192.168.252.122:27002"

  22.        },

  23.        {

  24.            "_id" : 2,

  25.            "host" : "192.168.252.123:27002"

  26.        }

  27.    ]

  28. }

  29. > rs.initiate(config)

  30. { "ok" : 1 }

  31. shard2:SECONDARY> rs.status()

3.3 设置第三个分片副本集

 
   
   
 
  1. vi /usr/local/mongodb/conf/shard3.conf

  2. #配置文件内容

  3. #——————————————–

  4. pidfilepath = /usr/local/mongodb/shard3/log/shard3.pid

  5. dbpath = /usr/local/mongodb/shard3/data

  6. logpath = /usr/local/mongodb/shard3/log/shard3.log

  7. logappend = true

  8. bind_ip = 0.0.0.0

  9. port = 27003

  10. fork = true

  11. #副本集名称

  12. replSet=shard3

  13. #declare this is a shard db of a cluster;

  14. shardsvr = true

  15. #设置最大连接数

  16. maxConns=20000

启动三台服务器的shard3 server

 
   
   
 
  1. mongod -f /usr/local/mongodb/conf/shard3.conf

登陆任意一台服务器,初始化副本集(除了192.168.252.121)

 
   
   
 
  1. mongo --port 27003

使用admin数据库

 
   
   
 
  1. use admin

定义副本集配置

 
   
   
 
  1. config = {

  2.    _id : "shard3",

  3.     members : [

  4.         {_id : 0, host : "192.168.252.121:27003" },

  5.         {_id : 1, host : "192.168.252.122:27003" , arbiterOnly: true},

  6.         {_id : 2, host : "192.168.252.123:27003" }

  7.     ]

  8. }

初始化副本集配置

 
   
   
 
  1. rs.initiate(config)

响应内容如下

 
   
   
 
  1. > use admin

  2. switched to db admin

  3. > config = {

  4. ...     _id : "shard3",

  5. ...      members : [

  6. ...          {_id : 0, host : "192.168.252.121:27003" },

  7. ...          {_id : 1, host : "192.168.252.122:27003" , arbiterOnly: true},

  8. ...          {_id : 2, host : "192.168.252.123:27003" }

  9. ...      ]

  10. ...  }

  11. {

  12.    "_id" : "shard3",

  13.    "members" : [

  14.        {

  15.            "_id" : 0,

  16.            "host" : "192.168.252.121:27003"

  17.        },

  18.        {

  19.            "_id" : 1,

  20.            "host" : "192.168.252.122:27003",

  21.            "arbiterOnly" : true

  22.        },

  23.        {

  24.            "_id" : 2,

  25.            "host" : "192.168.252.123:27003"

  26.        }

  27.    ]

  28. }

  29. > rs.initiate(config)

  30. { "ok" : 1 }

  31. shard3:SECONDARY> rs.status()

3.4 配置路由服务器 mongos

(三台机器)先启动配置服务器和分片服务器,后启动路由实例启动路由实例:

 
   
   
 
  1. vi /usr/local/mongodb/conf/mongos.conf

  2. #内容

  3. pidfilepath = /usr/local/mongodb/mongos/log/mongos.pid

  4. logpath = /usr/local/mongodb/mongos/log/mongos.log

  5. logappend = true

  6. bind_ip = 0.0.0.0

  7. port = 20000

  8. fork = true

  9. #监听的配置服务器,只能有1个或者3个 configs为配置服务器的副本集名字

  10. configdb = configs/192.168.252.121:21000,192.168.252.122:21000,192.168.252.123:21000

  11. #设置最大连接数

  12. maxConns = 20000

启动三台服务器的mongos server

 
   
   
 
  1. mongos -f /usr/local/mongodb/conf/mongos.conf

4. 串联路由服务器

目前搭建了mongodb配置服务器、路由服务器,各个分片服务器,不过应用程序连接到mongos路由服务器并不能使用分片机制,还需要在程序里设置分片配置,让分片生效。

登陆任意一台mongos

 
   
   
 
  1. mongo --port 20000

使用admin数据库

 
   
   
 
  1. use  admin

串联路由服务器与分配副本集

 
   
   
 
  1. sh.addShard("shard1/192.168.252.121:27001,192.168.252.122:27001,192.168.252.123:27001");

  2. sh.addShard("shard2/192.168.252.121:27002,192.168.252.122:27002,192.168.252.123:27002");

  3. sh.addShard("shard3/192.168.252.121:27003,192.168.252.122:27003,192.168.252.123:27003");

查看集群状态

 
   
   
 
  1. sh.status()

响应内容如下

 
   
   
 
  1. mongos> sh.status()

  2. --- Sharding Status ---

  3.  sharding version: {

  4.      "_id" : 1,

  5.      "minCompatibleVersion" : 5,

  6.      "currentVersion" : 6,

  7.      "clusterId" : ObjectId("5a713a37d56e076f3eb47acf")

  8.  }

  9.  shards:

  10.        {  "_id" : "shard1",  "host" : "shard1/192.168.252.121:27001,192.168.252.122:27001",  "state" : 1 }

  11.        {  "_id" : "shard2",  "host" : "shard2/192.168.252.122:27002,192.168.252.123:27002",  "state" : 1 }

  12.        {  "_id" : "shard3",  "host" : "shard3/192.168.252.121:27003,192.168.252.123:27003",  "state" : 1 }

  13.  active mongoses:

  14.        "3.6.2" : 3

  15.  autosplit:

  16.        Currently enabled: yes

  17.  balancer:

  18.        Currently enabled:  yes

  19.        Currently running:  no

  20.        Failed balancer rounds in last 5 attempts:  0

  21.        Migration Results for the last 24 hours:

  22.                No recent migrations

  23.  databases:

  24.        {  "_id" : "config",  "primary" : "config",  "partitioned" : true }

  25. mongos>

5. 启用集合分片生效

目前配置服务、路由服务、分片服务、副本集服务都已经串联起来了,但我们的目的是希望插入数据,数据能够自动分片。连接在mongos上,准备让指定的数据库、指定的集合分片生效。

登陆任意一台mongos

 
   
   
 
  1. mongo --port 20000

使用admin数据库

 
   
   
 
  1. use  admin

指定testdb分片生效

 
   
   
 
  1. db.runCommand( { enablesharding :"testdb"});

指定数据库里需要分片的集合和片键,哈希id 分片

 
   
   
 
  1. db.runCommand( { shardcollection : "testdb.table1",key : {"id": "hashed"} } );

我们设置testdb的 table1 表需要分片,根据 id 自动分片到 shard1 ,shard2,shard3 上面去。要这样设置是因为不是所有mongodb 的数据库和表 都需要分片!

测试分片配置结果

连接 MongoDB 路由服务

 
   
   
 
  1. mongo  127.0.0.1:20000

切换到 testdb 数据库

 
   
   
 
  1. use  testdb;

插入测试数据

 
   
   
 
  1. for(i=1;i<=100000;i++){db.table1.insert({"id":i,"name":"penglei"})};

总条数

 
   
   
 
  1. db.table1.aggregate([{$group : {_id : "$name", totle : {$sum : 1}}}])

查看分片情况如下

  • shard1: "count": 33755

  • shard2: "count": 33143,

  • shard3: "count": 33102

结论数据基本均匀

 
   
   
 
  1. db.table1.stats();

 
   
   
 
  1. mongos> db.table1.stats();

  2. {

  3.    "sharded": true,

  4.    "capped": false,

  5.    "ns": "testdb.table1",

  6.    "count": 100000,

  7.    "size": 5200000,

  8.    "storageSize": 1519616,

  9.    "totalIndexSize": 3530752,

  10.    "indexSizes": {

  11.        "_id_": 892928,

  12.        "id_hashed": 2637824

  13.    },

  14.    "avgObjSize": 52,

  15.    "nindexes": 2,

  16.    "nchunks": 6,

  17.    "shards": {

  18.        "shard1": {

  19.            "ns": "testdb.table1",

  20.            "size": 1755260,

  21.            "count": 33755,

  22.            "avgObjSize": 52,

  23.            "storageSize": 532480,

  24.            "capped": false,

  25.            "wiredTiger": {

  26.            ...省略很多

  27.            }

  28.        },

  29.        "shard2": {

  30.            "ns": "testdb.table1",

  31.            "size": 1723436,

  32.            "count": 33143,

  33.            "avgObjSize": 52,

  34.            "storageSize": 479232,

  35.            "capped": false,

  36.            "wiredTiger": {

  37.            ...省略很多

  38.            }

  39.        },

  40.        "shard3": {

  41.            "ns": "testdb.table1",

  42.            "size": 1721304,

  43.            "count": 33102,

  44.            "avgObjSize": 52,

  45.            "storageSize": 507904,

  46.            "capped": false,

  47.            "wiredTiger": {

  48.            ...省略很多

  49.            }

  50.        }

  51.    },

  52.    "ok": 1,

  53.    "$clusterTime": {

  54.        "clusterTime": Timestamp(1517488062, 350),

  55.        "signature": {

  56.            "hash": BinData(0, "AAAAAAAAAAAAAAAAAAAAAAAAAAA="),

  57.            "keyId": NumberLong(0)

  58.        }

  59.    },

  60.    "operationTime": Timestamp(1517488062, 350)

  61. }

  62. mongos>

分组查看总数量是:100000

 
   
   
 
  1. mongos> db.table1.aggregate([{$group : {_id : "$name", totle : {$sum : 1}}}])

  2. { "_id" : "penglei", "totle" : 100000 }

  3. mongos>

后期运维

参考

手把手教你 MongoDB 的安装与详细使用(一)

http://www.ymq.io/2018/01/26/MongoDB-1/

手把手教你 MongoDB 的安装与详细使用(二)

http://www.ymq.io/2018/01/29/MongoDB-2/

创建索引

 
   
   
 
  1. db.table1.createIndex({"name":1})

  2. db.table1.getIndexes()

启动

mongodb的启动顺序是,先启动配置服务器,在启动分片,最后启动mongos.

 
   
   
 
  1. mongod -f /usr/local/mongodb/conf/config.conf

  2. mongod -f /usr/local/mongodb/conf/shard1.conf

  3. mongod -f /usr/local/mongodb/conf/shard2.conf

  4. mongod -f /usr/local/mongodb/conf/shard3.conf

  5. mongod -f /usr/local/mongodb/conf/mongos.conf

启动报错

 
   
   
 
  1. about to fork child process, waiting until server is ready for connections.

  2. forked process: 1303

  3. child process started successfully, parent exiting

  4. [root@node1 ~]# mongod -f /usr/local/mongodb/conf/shard1.conf

  5. about to fork child process, waiting until server is ready for connections.

  6. forked process: 1384

删除 mongod.lock

 
   
   
 
  1. cd /usr/local/mongodb/shard1/data

  2. rm -rf mongod.lock

关闭

 
   
   
 
  1. #debian、ubuntu系统下:

  2. apt-get install psmisc

  3. #centos或、rhel系统下:

  4. yum install psmisc

关闭时,直接killall杀掉所有进程

 
   
   
 
  1. killall mongod

  2. killall mongos

参考:

Contact

  • 出处:http://www.ymq.io/2018/01/29/MongoDB-2

  • 版权归作者所有,转载请注明出处


以上是关于搭建 MongoDB分片(sharding) / 分区 / 集群环境的主要内容,如果未能解决你的问题,请参考以下文章

搭建 MongoDB分片(sharding) / 分区 / 集群环境

搭建 MongoDB分片(sharding) / 分区 / 集群环境

笔记14:MongoDB分片集群Shard Cluster搭建

笔记14:MongoDB分片集群Shard Cluster搭建

MongoDB分片集群搭建

搭建mongodb集群(副本集+分片)