在Mongodb里面存在另一种集群,就是分片技术,可以满足MongoDB数据量大量增长的需求。
当MongoDB存储海量的数据时,一台机器可能不足以存储数据,也可能不足以提供可接受的读写吞吐量。这时,我们就可以通过在多台机器上分割数据,使得数据库系统能存储和处理更多的数据。
环境准备
Linux环境
主机 | OS | 备注 |
---|---|---|
192.168.32.13 | CentOS6.3 64位 | 普通PC |
192.168.71.43 | CentOS6.2 64位 | 服务器,NUMA CPU架构 |
MongoDB版本:mongodb-linux-x86_64-2.4.1,下载地址:www.mongodb.org/downloads.
MongoDB安装:分别在两台机器上安装好mongodb 2.4.1,安装路径都为/url/local/mongodb-2.4.1/
cd /usr/local/src/
wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.4.1.tgz
tar -zxvf mongodb-linux-x86_64-2.4.1.tgz
cp -r mongodb-linux-x86_64-2.4.1 /usr/local/mongodb-2.4.1
cd /usr/local/mongodb-2.4.1/bin/
ll
可以看到mongodb安装成功有如下模块:
**mongodb**启动和关闭等在后面集群搭建中有详细说明,在此不再赘述。
Sharding集群搭建
Mongodb一共有三种集群搭建的方式:Replica Set(副本集)、Sharding(切片)和Master-Slaver(主从)。下面要搭建的是Sharding,Sharding集群也是三种集群中最复杂的。
配置服务器启动(192.168.32.13:10000):
1. ./bin/mongod --fork --dbpath data/config/ --logpath log/config.log –port 10000
路由服务器启动(192.168.32.13:20000):
1. ./bin/mongos --port 20000 --configdb 192.168.32.13:10000 --logpath log/mongos.log --fork
注意1:配置–conigdb的时候ip地址不能填localhost或127.0.0.1否则添加分片时会返回如下错误信息:
1. {
2. "ok" : 0,
3. "errmsg" : "can't use localhost as a shard since all shards need to communicate. either use all shards and configdbs in localhost or all in actual IPs host: 192.168.71.43:27017 isLocalHost:0"
4. }
启动分片1(192.168.32.13:27019):
1. ./bin/mongod --dbpath data/shard3/ --logpath log/shard3.log --fork --port 27019
启动分片2(192.168.32.13:27020):
1. ./bin/mongod --dbpath data/shard3/ --logpath log/shard3.log --fork --port 27020
启动分片3(192.168.71.43:27017):
1. numactl --interleave=all ./bin/mongod --dbpath data/shard1/ --logpath log/shard1.log --fork --port 27017
启动分片4(192.168.71.43:27018):
1. numactl --interleave=all ./bin/mongod --dbpath data/shard2/ --logpath log/shard2.log --fork --port 27018
说明:关于这里为什么加numactl –interleave=all,后面有详细说明。
Note:在生产环境可以将启动的配置信息写入文件,然后启动的时候指定配置文件,这样便于管理:
1. vi conf/config.conf
2. bpath=data/config/
3. logpath=log/config.log
4. port=10000
5. fork=true
6. ./bin/mongod -f conf/config.conf
添加分片1(192.168.32.13:27019):
1. ./bin/mongo --port 20000
2. mongos> use admin
3. switched to db admin
4. mongos> db.runCommand({addshard:"192.168.32.13:27019",allowLocal:true })
注意2:同样这里的192.168.32.13不能用localhost或127.0.0.1代替,并且当路由进程和分片在同一台机器上要指定allowLocal为true,因为MongoDB尽量避免错误的配置,将集群配置在本地,所以这个配置指明当前仅仅是用于开发。
添加分片3(192.168.71.43:27017):
1. mongos> db.runCommand({addshard:"192.168.71.43:27017" })
类似的添加分片2,4。
分片添加成功返回类似下面的信息(当前mongodb版本为2.4.1):
1. { "shardAdded" : "shard0000", "ok" : 1 }
删除分片:如果要删除分片的话可以removeshard命令:
1. mongos> use admin
2. switched to db admin
3. mongos> db.runCommand({"removeshard":"192.168.32.13:27020"})
4. {
5. "msg" : "draining started successfully",
6. "state" : "started",
7. "shard" : "shard0001",
8. "note" : "you need to drop or movePrimary these databases",
9. "dbsToMove" : [
10. "test3"
11. ],
12. "ok" : 1
13. }
移除分片需要一个过程,MongoDB会把移除的片上的数据(块)挪到其他片上,移动中会显示进度:
1. mongos> db.runCommand({"removeshard":"192.168.32.13:27020"})
2. {
3. "msg" : "draining ongoing",
4. "state" : "ongoing",
5. "remaining" : {
6. "chunks" : NumberLong(0),
7. "dbs" : NumberLong(1)
8. },
9. "note" : "you need to drop or movePrimary these databases",
10. "dbsToMove" : [
11. "test3"
12. ],
13. "ok" : 1
14. }
注意:如果删除的片是数据库的大本营(基片),必须手动移动或删除数据库,用moveprimary命令,上面的示例中就提示192.168.32.13:27020是test3库的大本营(primary),这个信息可以通过查看config.databases看到:
1. mongos> use config
2. switched to db config
3. mongos> db.databases.find()
4. { "_id" : "test3", "partitioned" : false, "primary" : "shard0001" }
这里shard0001就是192.168.32.13:27020,下面通过moveprimary命令移除test3:
1. mongos> use admin
2. switched to db admin
3. mongos> db.runCommand({"moveprimary":"test3","to":"192.168.32.13:27019"})
4. { "primary " : "shard0000:192.168.32.13:27019", "ok" : 1 }
这时再查看config.databases会发现test3的大本营变成了shard0000(192.168.32.13:27019)
这时再执行removeshard命令则能成功移除分片了:
1. mongos> db.runCommand({"removeshard":"192.168.32.13:27020"})
2. {
3. "msg" : "removeshard completed successfully",
4. "state" : "completed",
5. "shard" : "shard0001",
6. "ok" : 1
7. }
管理分片
进入mongos进程config库可以看到目前分片的情况:
1. ./bin/mongo –port 20000
2. use config
3. db.shards.find()
1. mongos> use config
2. switched to db config
3. mongos> db.shards.find()
4. { "_id" : "shard0000", "host" : "192.168.32.13:27019" }
5. { "_id" : "shard0001", "host" : "192.168.71.43:27017" }
6. { "_id" : "shard0002", "host" : "192.168.71.43:27018" }
注意3:如果配置过程中发生过上面注意1中出现的情况,即配置configdb的时候用了localhost或127.0.0.1,则运行db.shards.find()可能会出现如下错误:
1. mongos> db.shards.find()
2. error: {
3. "$err" : "could not initialize sharding on connection 192.168.32.13:10000 :: caused by :: mongos specified a different config database string : stored : localhost:10000 vs given : 192.168.32.13:10000",
4. "code" : 15907
5. }
解决方法是重新启动config进程。
查看分片后的数据库:
1. ./bin/mongo –port 20000
2. use test
3. db.test.user.insert({“test”: “test”})
4. ……
5. use config
6. db.databases.find()
7. { "_id" : "admin", "partitioned" : false, "primary" : "config" }
8. { "_id" : "test", "partitioned" : false, "primary" : "shard0000" }
9. { "_id" : "test2", "partitioned" : false, "primary" : "shard0000" }
10. { "_id" : "test3", "partitioned" : false, "primary" : "shard0001" }
“_id”,字符串。表示数据库名。
“partioned”,布尔型。如果为true则表示开启了分片功能。
“primary”,字符串,这个值与“_id”对应表示这个数据库的“大本营“在哪里,不论分片与否,数据库总是会有个“大本营”,创建数据库时会随机选择一个片,也就是说大本营是开始创建数据库文件的位置。虽然分片的时候数据库也会用到很多别的服务器,但是从这分片开始。
至此整个mongodb分片集群基本搭建完成,但是想让分片正常、高效、稳定的运行还有很多工作要做,下一节将在此基础上做一些简单的测试。
以上就是良许教程网为各位朋友分享的Linu系统相关内容。想要了解更多Linux相关知识记得关注公众号“良许Linux”,或扫描下方二维码进行关注,更多干货等着你 !