美文网首页
mongodb安装

mongodb安装

作者: brightranger | 来源:发表于2017-03-29 15:58 被阅读21次

简单安装

下载mongodb

https://www.mongodb.com/download-center#community

上传mongodb安装包

<pre>
mongodb-linux-x86_64-3.0.6.gz
</pre>

解压包、创建目录

<pre>
[root@localhost mongodb]# mkdir mongodb
[root@localhost mongodb]# cd mongdb
[root@localhost mongodb]# tar -xvf mongodb-linux-x86_64-3.0.6.gz
[root@localhost mongodb]# mkdir data
[root@localhost mongodb]# mkdir logs
[root@localhost mongodb]# cd logs
[root@localhost mongodb]# vi mongdb.out
[root@localhost mongodb]# cd ../bin
</pre>

后台方式启动

<pre>
./mongod --dbpath=/app/mongodb/data/ --logpath=/app/mongodb/logs/mongodb.log --fork
</pre>

分片安装

概念:

分片(sharding)是指将数据库拆分,将其分散在不同的机器上的过程。将数据分散到不同的机器上,不需要功能强大的服务器就可以存储更多的数据和处理更大的负载。基本思想就是将集合切成小块,这些块分散到若干片里,每个片只负责总数据的一部分,最后通过一个均衡器来对各个分片进行均衡(数据迁移)。通过一个名为mongos的路由进程进行操作,mongos知道数据和片的对应关系(通过配置服务器)。大部分使用场景都是解决磁盘空间的问题,对于写入有可能会变差(+++里面的说明+++),查询则尽量避免跨分片查询。使用分片的时机:

1、机器的磁盘不够用了。使用分片解决磁盘空间的问题。
2、单个mongod已经不能满足写数据的性能要求。通过分片让写压力分散到各个分片上面,使用分片服务器自身的资源。
3、想把大量数据放到内存里提高性能。和上面一样,通过分片使用分片服务器自身的资源。

**部署安装: **前提是安装了mongodb(本文用3.0测试)

在搭建分片之前,先了解下分片中各个角色的作用。

  • 配置服务器:是一个独立的mongod进程,保存集群和分片的元数据,即各分片包含了哪些数据的信息。最先开始建立,启用日志功能。像启动普通的mongod一样启动配置服务器,指定configsvr选项。不需要太多的空间和资源,配置服务器的1KB空间相当于真实数据的200MB。保存的只是数据的分布表。当服务不可用,则变成只读,无法分块、迁移数据。
  • 路由服务器:即mongos,起到一个路由的功能,供程序连接。本身不保存数据,在启动时从配置服务器加载集群信息,开启mongos进程需要知道配置服务器的地址,指定configdb选项。
  • 分片服务器:是一个独立普通的mongod进程,保存数据信息。可以是一个副本集也可以是单独的一台服务器。
部署环境

这里只使用一台机子部署。只用于测试
1个配置服务器
1个路由服务器
2个分片服务器

在部署之前先明白片键的意义,一个好的片键对分片至关重要。片键必须是一个索引,数据根据这个片键进行拆分分散。通过sh.shardCollection加会自动创建索引。一个自增的片键对写入和数据均匀分布就不是很好,因为自增的片键总会在一个分片上写入,后续达到某个阀值可能会写到别的分片。但是按照片键查询会非常高效。随机片键对数据的均匀分布效果很好。注意尽量避免在多个分片上进行查询。在所有分片上查询,mongos会对结果进行归并排序。
启动上面这些服务,因为在后台运行,所以用配置文件启动,配置文件说明

配置服务器的启动

创建如下配置服务配置文件(confServer.conf)
<pre>

数据目录

dbpath=/usr/local/config/

日志文件

logpath=/var/log/mongodb/mongodb_config.log

日志追加

logappend=true

端口

port = 20000

最大连接数

maxConns = 50
pidfilepath = /var/run/mongo_20000.pid

日志,redo log

journal = true

刷写提交机制

journalCommitInterval = 200

守护进程模式

fork = true

刷写数据到日志的频率

syncdelay = 60

storageEngine = wiredTiger

操作日志,单位M

oplogSize = 1000

命名空间的文件大小,默认16M,最大2G。

nssize = 16
noauth = true
unixSocketPrefix = /tmp
configsvr = true
</pre>

启动配置服务:
<pre>
./mongod -f ../config/confServer.conf
</pre>

路由服务器的启动

创建如下路由服务配置文件(route.conf)
<pre>

mongos

日志文件

logpath=/var/log/mongodb/mongodb_route.log

日志追加

logappend=true

端口

port = 30000

最大连接数

maxConns = 100

绑定地址

bind_ip=192.168.200.*,...,

pidfilepath = /var/run/mongo_30000.pid

configdb=192.168.200.A:20000,192.168.200.A:21000,192.168.200.A:22000 #必须是1个或则3个配置 。

configdb=127.0.0.1:20000 #报错

守护进程模式 fork = true

</pre>

启动mongos服务
<pre>
./mongos -f ../config/route.conf
</pre>

分片服务器的启动:

分片服务就是普通的mongo服务。创建如下两个分片配置文件。
<pre>
dbpath=/home/mongodb/mongodb3.0.6/data/mongod_40000
logpath=/home/mongodb/mongodb3.0.6/log/mongod_40000.log
logappend=true
port=40000
maxConns=100
pidfilepath=/home/mongodb/mongodb3.0.6/pid/mongod_40000.pid
fork=true
</pre>

<pre>
dbpath=/home/mongodb/mongodb3.0.6/data/mongod_40001
logpath=/home/mongodb/mongodb3.0.6/log/mongod_40001.log
logappend=true
port=40001
maxConns=100
pidfilepath=/home/mongodb/mongodb3.0.6/pid/mongod_40001.pid
fork=true
</pre>

启动分片服务
<pre>
./mongod -f ../config/mongod_40000.conf
./mongod -f ../config/mongod_40001.conf
</pre>

配置分片

登录路由服务mongos
<pre>
root@mongo1:~# mongo --port=30000
MongoDB shell version: 3.0.4
connecting to: 127.0.0.1:30000/test
mongos>
</pre>
添加分片:
<pre>
mongos> sh.status() #查看集群的信息
--- Sharding Status ---
sharding version: {
"_id" : 1,
"minCompatibleVersion" : 5,
"currentVersion" : 6,
"clusterId" : ObjectId("559f72470f93270ba60b26c6")
}
shards:
balancer:
Currently enabled: yes
Currently running: no
Failed balancer rounds in last 5 attempts: 0
Migration Results for the last 24 hours:
No recent migrations
databases:
{ "_id" : "admin", "partitioned" : false, "primary" : "config" }

mongos> sh.addShard("192.168.200.A:40000") #添加分片
{ "shardAdded" : "shard0000", "ok" : 1 }
mongos> sh.addShard("192.168.200.B:40000") #添加分片
{ "shardAdded" : "shard0001", "ok" : 1 }
mongos> sh.addShard("192.168.200.C:40000") #添加分片
{ "shardAdded" : "shard0002", "ok" : 1 }

mongos> sh.status() #查看集群信息
--- Sharding Status ---
sharding version: {
"_id" : 1,
"minCompatibleVersion" : 5,
"currentVersion" : 6,
"clusterId" : ObjectId("559f72470f93270ba60b26c6")
}
shards: #分片信息
{ "_id" : "shard0000", "host" : "192.168.200.A:40000" }
{ "_id" : "shard0001", "host" : "192.168.200.B:40000" }
{ "_id" : "shard0002", "host" : "192.168.200.C:40000" }
balancer:
Currently enabled: yes
Currently running: no
Failed balancer rounds in last 5 attempts: 0
Migration Results for the last 24 hours:
No recent migrations
databases:
{ "_id" : "admin", "partitioned" : false, "primary" : "config" }
</pre>

开启分片功能:sh.enableSharding("库名")、sh.shardCollection("库名.集合名",{"key":1})
<pre>
mongos> sh.enableSharding("dba") #首先对数据库启用分片
{ "ok" : 1 }
mongos> sh.status() #查看分片信息
--- Sharding Status ---...
...
databases:
{ "_id" : "admin", "partitioned" : false, "primary" : "config" }
{ "_id" : "test", "partitioned" : false, "primary" : "shard0000" }
{ "_id" : "dba", "partitioned" : true, "primary" : "shard0000" }

mongos> sh.shardCollection("dba.account",{"name":1}) #再对集合进行分片,name字段是片键。片键的选择:利于分块、分散写请求、查询数据。
{ "collectionsharded" : "dba.account", "ok" : 1 }
mongos> sh.status()
--- Sharding Status ---...
shards:
{ "_id" : "shard0000", "host" : "192.168.200.51:40000" }
{ "_id" : "shard0001", "host" : "192.168.200.52:40000" }
{ "_id" : "shard0002", "host" : "192.168.200.53:40000" }
...
databases:
{ "_id" : "admin", "partitioned" : false, "primary" : "config" }
{ "_id" : "test", "partitioned" : false, "primary" : "shard0000" }
{ "_id" : "dba", "partitioned" : true, "primary" : "shard0000" } #库
dba.account
shard key: { "name" : 1 } #集合
chunks:
shard0000 1
{ "name" : { "$minKey" : 1 } } -->> { "name" : { "$maxKey" : 1 } } on : shard0000 Timestamp(1, 0)
</pre>

上面加粗部分表示分片信息已经配置完成。要是出现:
<pre>
too many chunks to print, use verbose if you want to force print
</pre>
想要看到详细的信息则需要执行:
<pre>
mongos> sh.status({"verbose":1})
或则
mongos> db.printShardingStatus("vvvv")
或则
mongos> printShardingStatus(db.getSisterDB("config"),1)
</pre>

测试 :对dba库的account集合进行测试,随机写入,查看是否分散到3个分片中。

判断是否为shard:db.runCommand({isdbgrid:1})
<pre>
mongos> db.runCommand({isdbgrid:1})
{ "isdbgrid" : 1, "hostname" : "mongo3c", "ok" : 1 }
</pre>
通过一个python脚本进行随机写入:分别向A、B 2个mongos各写入10万条记录。
<pre>

!/usr/bin/env python

-- coding:utf-8 --

随即写MongoDB Shard 测试

import pymongo
import time
from random import Random
def random_str(randomlength=8):
str = ''
chars = 'AaBbCcDdEeFfGgHhIiJjKkLlMmNnOoPpQqRrSsTtUuVvWwXxYyZz0123456789'
length = len(chars) - 1
random = Random()
for i in range(randomlength):
str+=chars[random.randint(0, length)]
return str

def inc_data(conn):
db = conn.dba

db = conn.test

collection = db.account
for i in range(100000):
    str = ''
    chars = 'AaBbCcDdEeFfGgHhIiJjKkLlMmNnOoPpQqRrSsTtUuVvWwXxYyZz0123456789'
    length = len(chars) - 1
    random = Random()
    for i in range(15):
        str+=chars[random.randint(0, length)]
        string = str
    collection.insert({"name" : string, "age" : 123+i, "address" : "hangzhou"+string})

if name =='main':
conn = pymongo.MongoClient(host='192.168.200.A/B',port=30000)

StartTime = time.time()
print "===============$inc==============="
print "StartTime : %s" %StartTime
inc_data(conn)
EndTime = time.time()
print "EndTime : %s" %EndTime
CostTime = round(EndTime-StartTime)
print "CostTime : %s" %CostTime

</pre>
查看是否分片:db.collection.stats()
<pre>
mongos> db.account.stats() #查看集合的分布情况
...
...
"shards" : {
"shard0000" : {
"ns" : "dba.account",
"count" : 89710,
"size" : 10047520,
...
...
"shard0001" : {
"ns" : "dba.account",
"count" : 19273,
"size" : 2158576,
...
...
"shard0002" : {
"ns" : "dba.account",
"count" : 91017,
"size" : 10193904,
...
...
</pre>

相关文章

网友评论

      本文标题:mongodb安装

      本文链接:https://www.haomeiwen.com/subject/hazeottx.html