Linux运维数据库篇 搭建GFS分布式存储 实现数据的实时分布存储

Posted 鹧鸪鹄

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Linux运维数据库篇 搭建GFS分布式存储 实现数据的实时分布存储相关的知识,希望对你有一定的参考价值。

文章目录

一、GFS简介

开源的分布式文件系统
由存储服务器、客户端以及NFS/Samba 存储网关组成
无元数据服务器

文件系统组成

1、文件系统接口
2、对对像管理的软件集合
3、对象及属性

特点

扩展性和高性能
高可用性
全局统一命名空间
弹性卷管理
基于标准协议

专有名词

1、Brick(块存储服务器)实际存储用户数据的服务器
2、Volume本地文件系统的"分区"
3、FUSE用户空间的文件系统(类别EXT4),这是一个伪文件系统,用户端的交换模块
4、VFS(虚拟端口)内核态的虚拟文件系统,用户是提交请求给VFS 然后VFS交给FUSH,再交给GFS客户端,最后由客户端交给远端的存储
5、Glusterd(服务)是运行再存储节点的进程(客户端运行的是gluster client)GFS使用过程中整个GFS之间的交换由Gluster client 和glusterd完成

二、GFS的具体构成

特性

API:应用程序编程接口
模块化:每个模块可以提供不同的功能
堆栈式:同时启用多个模块,多个功能可以组合,实现复杂的功能

GFS的存储过程


1、用户端申请创建一个文件,客户端或应用程序通过GFS的挂载点访问数据
2、linux系统内容通过VFSAPI收到请求并处理
3、VFS将数据递交给FUSE内核文件系统,fuse文件系统则是将数据通过/dev/fuse设备文件递交给了GlusterFS client端
4、GlusterFS client端收到数据后,会根据配置文件的配置对数据进行处理
5、再通过网络,将数据发送给远端的ClusterFS server,并将数据写入到服务器储存设备上
6、server再将数据转交给VFS伪文件系统,再由VFS进行转存处理,最后交给EXT3

后端定位文件

弹性HASH算法
通过HASH算法得到一个固定长度的数据(这里是32位整数)
通常情况下,不同数据得到的结果是不同的

为了解决分布式文件数据索引、定位的复杂程度,而使用了HASH算法来辅助

GFS存储的卷类型

1、分布式卷(默认):文件通过HASH算法分布到所有Brick Server上,这种卷是GFS的基础;以文件为单位根据HASH算法散列到不同的Brick,其实只是扩大了磁盘空间,并不具备容错能力,属于文件级RAID 0
2、条带卷(默认):类似RAID 0,文件被分成数据库并以轮询的方式分布到多个Brick Server上,文件存储以数据块为单位,支持大文件存储,文件越大,读取效率越高
3、复制卷:将文件同步到多个Brick上,使其具备多个文件副本,属于文件级RAID 1,具有容错能力。因为数据分散在多个Brick中,所以读性能得到很大提升,但写性能下降
4、分布式条带卷:Brick Server数量是条带数(数据块分布的Brick数量)的倍数,兼具分布式卷和条带的特点
5、分布式复制卷:Brick Server数量是镜像数(数据副本 数量)的倍数,兼具分布式卷和复制卷的特点
6、条带复制卷:类似RAID 10,同时具有条带卷和复制卷的特点
7、分布式条带复制卷:三种基本卷的复合卷通常用于类Map Reduce应用

在现网环境中前5种用的多

三 GFS搭建

1 创建磁盘

先将节点的硬盘分区格式化挂载 每个节点4快盘 实验环境无需那么大的磁盘空间 并格式化分区后挂载

fdisk /dev/sdb
n /m/m/m/m/m
w
mkfs.xfs /dev/sdb1
mkfs.xfs /dev/sdc1
mkfs.xfs /dev/sdd1
mkfs.xfs /dev/sde1
mount /dev/sdb1 /mnt
mkdir /a1
mount /dev/sdc1 /a1
mkdir /a2
mount /dev/sdd1 /a2
mkdir /a3
mount /dev/sde1 /a3



2 更改节点名

hostname node1
su -




映射主机名

每个节点都要映射

echo "192.168.30.100 node1" >> /etc/hosts
echo "192.168.30.20 node2" >> /etc/hosts
echo "192.168.30.15 node3" >> /etc/hosts
echo "192.168.30.10 node4" >> /etc/hosts

解压包并配置本地yum源

unzip gfsrepo.zip
cd /etc/yum.repos.d/
mv * repos.bak/
vim glfs.repo
[glfs]
name=glfs
baseurl=file:///opt/gfsrepo
gpgcheck=0
enabled=1

yum clean all && yum makecache

yum -y install glusterfs glusterfs-server glusterfs-fuse glusterfs-rdma

systemctl start glusterd.service
systemctl enable glusterd.service
systemctl status glusterd.service


时间同步

ntpdate ntp1.aliyun.com
11 May 16:02:43 ntpdate[50853]: adjust time server 120.25.115.20 offset 0.000083 sec

添加节点到节点池

gluster peer probe node1
gluster peer probe node2
gluster peer probe node3
gluster peer probe node4
gluster peer status


查看节点 图为node1

创建卷类型

只创建前五种 因为常用
卷类型规划

卷名称 				卷类型				Brick
dis-volume			分布式卷			node1(/data/sdb1)、node2(/data/sdb1)
stripe-volume		条带卷			node1(/data/sdc1)、node2(/data/sdc1)
rep-volume			复制卷			node3(/data/sdb1)、node4(/data/sdb1)
dis-stripe			分布式条带卷		node1(/data/sdd1)、node2(/data/sdd1)、node3(/data/sdd1)、node4(/data/sdd1)
dis-rep				分布式复制卷		node1(/data/sde1)、node2(/data/sde1)、node3(/data/sde1)、node4(/data/sde1)

创建分布式卷

[root@node1 yum.repos.d] gluster volume create dis-volume node1:/mnt/sdb1 node2:/a1/sdb1 force
volume create: dis-volume: success: please start the volume to access data
[root@node1 yum.repos.d] gluster volume list
dis-volume
[root@node1 yum.repos.d]gluster volume start dis-volume
volume start: dis-volume: success
[root@node1 yum.repos.d] gluster volume info dis-volume
 
Volume Name: dis-volume
Type: Distribute
Volume ID: 6864f1df-7f03-4b03-9fe1-335954bdfa0a
Status: Started
Snapshot Count: 0
Number of Bricks: 2
Transport-type: tcp
Bricks:
Brick1: node1:/mnt/sdb1
Brick2: node2:/a1/sdb1
Options Reconfigured:
transport.address-family: inet
nfs.disable: on
[root@node1 yum.repos.d]# 

创建条带卷

[root@node1 yum.repos.d]gluster volume create stripe-volume stripe 2 node1:/a1/sdc1 node2:/a2/sdc1 force
volume create: stripe-volume: success: please start the volume to access data
[root@node1 yum.repos.d] gluster volume start stripe-volume
volume start: stripe-volume: success
[root@node1 yum.repos.d] gluster volume info stripe-volume
 
Volume Name: stripe-volume
Type: Stripe
Volume ID: b9e98cfe-181d-49bb-8026-a09a2f000c05
Status: Started
Snapshot Count: 0
Number of Bricks: 1 x 2 = 2
Transport-type: tcp
Bricks:
Brick1: node1:/a1/sdc1
Brick2: node2:/a2/sdc1
Options Reconfigured:
transport.address-family: inet
nfs.disable: on
[root@node1 yum.repos.d]# 


创建复制卷

[root@node1 yum.repos.d] gluster volume create rep-volume replica 2 node3:/a1/sdb1 node4:/a1/sdb1 force
volume create: rep-volume: success: please start the volume to access data
[root@node1 yum.repos.d] gluster volume start rep-volume
volume start: rep-volume: success
[root@node1 yum.repos.d] gluster volume info rep-volume
 
Volume Name: rep-volume
Type: Replicate
Volume ID: de8bae45-8310-4076-aee2-1b73a8b8d217
Status: Started
Snapshot Count: 0
Number of Bricks: 1 x 2 = 2
Transport-type: tcp
Bricks:
Brick1: node3:/a1/sdb1
Brick2: node4:/a1/sdb1
Options Reconfigured:
transport.address-family: inet
nfs.disable: on
[root@node1 yum.repos.d]# 


创建分布式条带卷
#指定类型为 stripe,数值为 2,而且后面跟了 4 个 Brick Server,是 2 的两倍,所以创建的是分布式条带卷

[root@node1 yum.repos.d] gluster volume create dis-stripe stripe 2 node1:/a2/sdd1 node2:/a3/sdd1 node3:/a3/sdd1 node4:/a3/sdd1 
volume create: dis-stripe: success: please start the volume to access data
[root@node1 yum.repos.d] gluster volume start dis-stripe
volume start: dis-stripe: success
[root@node1 yum.repos.d] gluster volume info dis-stripe
 
Volume Name: dis-stripe
Type: Distributed-Stripe
Volume ID: 6631000e-64aa-45fb-bcdb-1c395d4054f7
Status: Started
Snapshot Count: 0
Number of Bricks: 2 x 2 = 4
Transport-type: tcp
Bricks:
Brick1: node1:/a2/sdd1
Brick2: node2:/a3/sdd1
Brick3: node3:/a3/sdd1
Brick4: node4:/a3/sdd1
Options Reconfigured:
transport.address-family: inet
nfs.disable: on
[root@node1 yum.repos.d]# 


创建分布式复制卷
指定类型为 replica,数值为 2,而且后面跟了 4 个 Brick Server,是 2 的两倍,所以创建的是分布式复制卷

[root@node1 yum.repos.d]# gluster volume create dis-rep replica 2 node1:/a3/sde1 node2:/a4/sde1 node3:/a4/sde1 node4:/a4/sde1
volume create: dis-rep: success: please start the volume to access data
[root@node1 yum.repos.d]# gluster volume start dis-rep
volume start: dis-rep: success
[root@node1 yum.repos.d]# gluster volume info dis-rep 
 
Volume Name: dis-rep
Type: Distributed-Replicate
Volume ID: b29d6cb4-b9f2-4738-9d64-4a6bab840163
Status: Started
Snapshot Count: 0
Number of Bricks: 2 x 2 = 4
Transport-type: tcp
Bricks:
Brick1: node1:/a3/sde1
Brick2: node2:/a4/sde1
Brick3: node3:/a4/sde1
Brick4: node4:/a4/sde1
Options Reconfigured:
transport.address-family: inet
nfs.disable: on
[root@node1 yum.repos.d]# 


检查所创建的卷类型

gluster volume list

四 部署客户端

cd /opt
unzip gfsrepo.zip 

cd /etc/yum.repos.d/
mv * repos.bak/

vim glfs.repo
[glfs]
name=glfs
baseurl=file:///opt/gfsrepo
gpgcheck=0
enabled=1

yum clean all && yum makecache

yum -y install glusterfs glusterfs-fuse

mkdir -p /test/dis,stripe,rep,dis_stripe,dis_rep

echo "192.168.30.100 node1" >> /etc/hosts
echo "192.168.30.20 node2" >> /etc/hosts
echo "192.168.30.15 node3" >> /etc/hosts
echo "192.168.30.10 node4" >> /etc/hosts

mount.glusterfs node1:dis-volume /text/dis
mount.glusterfs node1:stripe-volume /text/stripe
mount.glusterfs node1:rep-volume /text/rep
mount.glusterfs node1:dis-stripe /text/dis_stripe
mount.glusterfs node1:dis-rep /text/dis_rep

df -hT




检查

1、查看分布式文件分布
node1:ll -h /mnt/sdb1
node2:ll -h /a2/sdb1
2、查看条带卷文件分布
node1:ll -h /a2/sdc1
node2:ll -h /a2/sdc1
3、查看复制卷文件分布
node3:ll -h /a1/sdb1
node4:ll -h /a1/sdb1
4、查看分布式条带卷分布
node1:ll -h /a3/sdd1
node2:ll -h /a3/sdd1
node3:ll -h /a3/sdd1
node4:ll -h /a3/sdd1
5、查看分布式复制卷分布
node1:ll -h /a4/sde1
node2:ll -h /a4/sde1
node3:ll -h /a4/sde1
node4:ll -h /a4/sde1

node1

node2

node3

node4

冗余测试

关闭node2和4 查看

复制数据的较安全 条带化没用冗余不是很安全

其余命令

1.查看GlusterFS卷
gluster volume list

2.查看所有卷的信息
gluster volume info

3.查看所有卷的状态
gluster volume status

4.停止一个卷
gluster volume stop dis-stripe

5.删除一个卷,注意:删除卷时,需要先停止卷,且信任池中不能有主机处于宕机状态,否则删除不成功
gluster volume delete dis-stripe

6.设置卷的访问控制
#仅拒绝
gluster volume set dis-rep auth.allow 192.168.184.100

#仅允许
gluster volume set dis-rep auth.allow 192.168.30.0 #设置192.168.30.0网段的所有IP地址都能访问dis-rep卷(分布式复制卷)

以上是关于Linux运维数据库篇 搭建GFS分布式存储 实现数据的实时分布存储的主要内容,如果未能解决你的问题,请参考以下文章

搭建 GFS 分布式文件系统-----实操

GFS分布式文件系统集群(理论篇)

强烈推荐!老板再也不用担心我的数据存储了-搭建GFS

HBase的简介和搭建

05.伪分布式分布式搭建

HDFS