分布式文件系统和企业级应用 ——rsync远程同步
Posted 封玖FJ
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了分布式文件系统和企业级应用 ——rsync远程同步相关的知识,希望对你有一定的参考价值。
rsync介绍
- rsync(Remote Sync,远程同步)是一个开源的快速备份工具,可以在不同主机之间镜像同步整个目录树,支持增量备份,并保持链接和权限,且采用优化的同步算法,传输前执行压缩,因此非常适用于异地备份、镜像服务器等应用
- rsync的官方站点的网址是 http://rsync.samba.org/,目前最新版本是3.1.3,由 Wayne Davison 进行维护。作为一种最常用的文件备份工具,rsync往往是Linux和UNIX系统默认安装的基本组件之一
rsync下行/拉取流程
- 在远程同步任务中,负责发起rsync同步操作的客户机称为发起端,而负责响应来自客户机的rsync同步操作的服务器称为同步源。
-
在同步过程中,同步源负责提供文件的原始位置,发起端应对该位置具有读取权限
例:
A服务器同步B服务器的数据,B服务器就是备份源
反过来,B服务器同步A服务器的数据,那么A服务器就是备份源
配置rsync下行同步
1、基本思路
- 建立rsyncd.conf配置文件、独立的rsunc账号文件
- 启用rsync的 --daemon模式
2、配置文件rsyncd.conf - 认证配置auth users、secrets file,不加则为匿名
3、独立的账号文件 - 用户名:密码
- 每行一个用户记录
- 独立的账号数据,不依赖系统账号
4、启用rsync服务 - 通过 --daemon独自提供服务,rsync --daemon
- 执行kill $(cat /var/run/rsyncd.pid)关闭服务
rsync命令格式
rsync [选项] 原始位置 目标位置
常用选项 | 说明 |
---|---|
-r | 递归模式,包含目录及子目录中的所有文件 |
-l | 对于符号链接文件仍然复制为符号链接文件 |
-v | 显示同步过程的详细信息 |
-z | 在传输文件时进行压缩 |
-a | 归档模式,递归并保留对象属性,等同于-rlptgoD |
-p | 保留文件的权限标记 |
-t | 保留文件的时间标记 |
-g | 保留文件的属组标记(仅超级用户使用) |
-o | 保留文件的属主标记(仅超级用户使用) |
-H | 保留硬链接文件 |
-A | 保留ACL属性信息 |
-D | 保留设备文件及其他特殊文件 |
--delete | 删除目标位置有而原始位置没有的文件 |
--checksum | 根据对象的校验和来决定是否跳过文件 |
--checksum | 根据对象的校验和来决定是否跳过文件 |
--password-file=file | 从file中得到密码,用于免交互处理,file文件的权限要是600 |
2. 配置rsync发起端测试备份Slave(192.168.163.20)
将指定的资源下载到本地/opt目录下进行备份
格式一:用户名@主机地址::共享模块名
rsync -avz backuper@192.168.163.10::wwwroot /opt/ #密码123456
格式二:rsync://用户名@主机地址/共享模块名
rsync -avz rsync://backuper@192.168.163.10/wwwroot /opt/
免交互格式
echo "密码" > /etc/密码文件
chmod 600 /etc/密码文件
#设置周期性任务
crontab -e
30 22 * * * /usr/bin/rsync -az --delete --password-file=/etc/密码文件 backuper@192.168.163.10::wwwroot /opt
systemctl restart crond
systemctl enable crond
rsync上行/推送流程
- Linux内核从 2.6.13 版本开始提供了inotify通知接口,用来监控文件系统的各种变化情况,如文件存取、删除、移动、修改等。利用这一机制,可以非常方便地实现文件异动告警、 增量备份,并针对目录或文件的变化及时作出响应
- 将inotify机制与rsync工具相结合,可以实现触发式备份(实时同步)——只要原始位 置的文档发生变化,则立即启动增量备份操作;否则处于静默等待状态,这样,就避免了按固定周期备份时存在的延迟性、周期过密等问题
- 因为inotify通知机制由linux内核提供,因此主要做本机监控,在触发式备份中应用时更适合上行同步
1. 调整inotify内核参数(优化)
/etc/sysctl.conf(内核参数配置文件),需要配置
1)max_queue_events :监控事件队列大小
2)max_user_instances :最多监控实例
3)max_user_watches :每个实例最多监控文件数
4)配置的监控数量应该大于监控目标的总文件数
例如:
vim /etc/sysctl.conf
max_queue_events = 16384
max_user_instances = 1024
max_user_watches = 1048576
2. 使用inotify-tools辅助工具
1)用inotify机制还需要安装 inotify-tools,以便提供 inotifywait、inotifywatch 辅助工具程序。
2)notifywait:可监控modify(修改)、create(创建)、move(移动)、delete(删除)、attrib(属性更改)等各种事件,一有变动立即输出结果。
3)inotifywatch:可用来收集文件系统变动情况,并在运行结束后输出汇总的变化情况
例:
inotifywait -mrq -e modify,create,attrib,move,delete 文件或目录
#参数解释#
-m 持续进行监控
-r 递归监控所有子对象
-q 简化输出信息
-e 指定要监控哪些事件类型
modify 修改
create 创建
attrib 属性更改
move 移动
deletc 删除
3. 编写触发式脚本(客户端)
vim /opt/inotify_rsynx.sh
#!/bin/bash
#定义两个变量:监控文件,执行备份
INOTIFY_CMD="inotifywait -mrq -e create,delete,move,modify,attrib /var/www/html/" 需要监控的目录或文件"
RSYNC_CMD="rsync -azH --delete --password-file=/etc/1.pass /var/www/html/ backuper@192.168.163.10::wwwroot/" 密码文件 刚才监控的目录或文件 用户名@主机地址::共享模块名"
#while read获取监控结果
$INOTIFY_CMD | while read DIRECTORY EVENT FILE
do
#如果rsync没有运行,执行rsync进行备份操作
if [ $(pgrep rsync | wc -l) -le 0 ] ; then
$RSYNC_CMD
fi
done
chmod +x inotify_rsynx.sh
mkdir -p /var/www/html/
chmod 777 /var/www/html/
ls -ld /var/www/html/
chmod +x /etc/rc.d/rc.local
echo "/root/jiankong.sh" >> /etc/rc.d/rc.local
实验
下行同步:将master服务器数据备份到slave服务器 |
主机 | IP地址 | 安装包 |
---|---|---|---|
Master | 192.168.163.10 | rsync | |
Slave | 192.168.163.20 | rsync / inotify-tools-3.14.tar.gz |
1. 配置rsync源服务器(192.168.163.10)
1. 关防火墙、安装相应的软件
systemctl stop firewalld.service
setenforce 0
#检查是否安装,一般系统已默认安装rsync
rpm -q rsync
yum -y install rsync
2. 建立/etc/rsyncd.conf 配置文件
- 如采用匿名的方式,只要将下面配置中的“auth users”和“secrets file”配置项去掉即可
vim /etc/rsyncd.conf uid = root gid = root use chroot = yes address = 192.168.163.10 port 873 log file = /var/log/rsyncd.log pid file = /var/run/rsyncd.pid hosts allow = 192.168.163.0/24 [wwwroot] path = /var/www/html comment = Document Root of www.test.com read only = yes dont comperss = *.gz *.bz2 *.tgz *.zip *.rar *.z auth users = backuper lisi secrets file = /etc/rsyncd_users.db #---------配置解释---------------------------------------------- uid = root gid = root use chroot = yes #禁锢在源目录 address = 192.168.163.10 #监听地址,监听本机地址 port 873 #监听端口 tcp/udp 873,可通过cat /etc/services | grep rsync查看 log file = /var/log/rsyncd.log #日志文件位置 pid file = /var/run/rsyncd.pid #存放进程 ID 的文件位置 hosts allow = 192.168.163.0/24 #允许同步的客户机网段 [wwwroot] #共享模块名称 path = /var/www/html #源目录的实际路径(同步的目录) comment = Document Root of www.test.com read only = yes #是否为只读 dont compress = *.gz *.bz2 *.tgz *.zip *.rar *.z #同步时不再压缩的文件类型 auth users = backuper zhangsan #授权账户,多个账号以空格分隔 secrets file = /etc/rsyncd_users.db #存放账户信息的数据文件
3. 为备份账户创建数据文件
- 无须建立同名系统用户
vim /etc/rsyncd_users.db zhangsan:123456
chmod 600 /etc/rsyncd_users.db
![15.png](https://s2.51cto.com/images/20220226/1645856128875846.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)
![16.png](https://s2.51cto.com/images/20220226/1645856128340640.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)
### 4. 保证所有用户对源目录/var/www/html(需要备份的文件目录)都有读取权限
yum -y install httpd
chmod +r /var/www/html
ls -ld /var/www/html
![17.png](https://s2.51cto.com/images/20220226/1645856329226274.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)
### 5. 启动 rsync 服务程序
- 启动 rsync 服务,以独立监听服务的方式(守护进程)运行
rsync --daemon
netstat -natp | grep rsync
![18.png](https://s2.51cto.com/images/20220226/1645856539977504.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)
### 6. 关闭 rsync 服务
kill $(cat /var/run/rsyncd.pid)
rm -rf /var/run/rsyncd.pid
![19.png](https://s2.51cto.com/images/20220226/1645856873408847.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)
### 7. 创建文件用于测试
cd /var/www/html
echo "this is test" >> 1.txt
cat 1.txt
![19.png](https://s2.51cto.com/images/20220226/1645857089184498.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)
## 1. Slave(192.168.163.20)
systemctl stop firewalld.service
setenforce 0
yum -y install rsync
cd /opt
mkdir abc
chmod 777 abc
vim /etc/server.pass
123456
chmod 600 /etc/server.pass
![20.png](https://s2.51cto.com/images/20220226/1645857613859531.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)
## 2. 验证
#### 1)Master(192.168.163.10)
cd /var/www/html/
vim 1.html
![21.png](https://s2.51cto.com/images/20220226/1645860914260527.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)
#### 2)Slave(192.168.163.20)
rsync -az --delete --password-file=/etc/server.pass lisi@192.168.163.10::wwwroot /opt/abc
ls abc
![22.png](https://s2.51cto.com/images/20220226/1645860927123444.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)
#### 3)加入到计划性任务
企业中不可能手动执行,一般都要使用周期性任务
#设置周期性任务
crontab -e
0 2 * /usr/bin/rsync -az --delete --password-file=/etc/server.pass lisi@192.168.163.10::wwwroot /opt/abc
systemctl restart crond
systemctl enable crond
# rsync+inotify实时同步
## 1. Master(192.168.163.10)
- 修改rsync源服务器配置文件
vim /etc/rsyncd.conf
#关闭只读,上行同步需要可以写
read only = no
#重启服务
kill cat /var/run/rsyncd.pid
netstat -natp | grep rsync
rsync --daemon
netstat -natp | grep rsync
chmod 777 /var/www/html
![23.png](https://s2.51cto.com/images/20220226/1645862571809100.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)
![24.png](https://s2.51cto.com/images/20220226/1645862538555328.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)
## 2. Slave(192.168.163.20)
### 1)调整 inotify 内核参数
max_queue_events(监控事件队列,默认值为16384)
max_user_instances(最多监控实例数,默认值为128)
max_user_watches(每个实例最多监控文件数,默认值为8192)
当要监控的目录、文件数量较多或者变化较频繁时,建议加大这三个参数的值。
cat /proc/sys/fs/inotify/max_queued_events
cat /proc/sys/fs/inotify/max_user_instances
cat /proc/sys/fs/inotify/max_user_watches
vim /etc/sysctl.conf
fs.inotify.max_queued_events = 17000
fs.inotify.max_user_instances = 1024
fs.inotify.max_user_watches = 1048576
sysctl -p
![25.png](https://s2.51cto.com/images/20220226/1645863900326537.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)
![26.png](https://s2.51cto.com/images/20220226/1645863900315352.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)
![27.png](https://s2.51cto.com/images/20220226/1645863900232281.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)
### 2)安装 inotify-tools
yum -y install gcc gcc-c++ make
#放入安装包
tar zxvf inotify-tools-3.14.tar.gz -C /opt
cd /opt/inotify-tools-3.14/
./configure && make && make install
![28.png](https://s2.51cto.com/images/20220226/1645864809762865.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)
![29.png](https://s2.51cto.com/images/20220226/1645864809634081.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)
### 3)编写触发式同步脚本
vim /opt/inotify_rsync.sh
#!/bin/bash
INOTIFY_CMD="inotifywait -mrq -e create,delete,move,modify,attrib /opt/abc/"
RSYNC_CMD="rsync -azH --delete --password-file=/etc/server.pass /opt/abc/ zhangsan@192.168.163.10::wwwroot"
$INOTIFY_CMD | while read DIRECTORY EVENT FILE
do
if [ $(pgrep rsync | wc -l) -le 0 ] ; then
$RSYNC_CMD
fi
done
cd /opt/
chmod +x inotify_rsync.sh
. /opt/inotify_rsync.sh &
#加入开机自动执行
chmod +x /etc/rc.d/rc.local
echo /opt/inotify_rsync.sh >> /etc/rc.d/rc.local
![30.png](https://s2.51cto.com/images/20220226/1645867064589500.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)
![31.png](https://s2.51cto.com/images/20220226/1645867064415938.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)
## 3. 查看上行结果
### 1)Slave(192.168.163.20)
cd /opt/abc
touch test.html
ls
rm -rf test.html
ls
### 2)Master(192.168.163.10)
cd /var/www/html
ls
![32.png](https://s2.51cto.com/images/20220226/1645867265509537.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)
![33.png](https://s2.51cto.com/images/20220226/1645867265970374.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)
# 使用rsync来实现快速删除大量文件
## 需求
假如要在Linux下删除大量文件,比如100万、1000万,像/usr/local/nginx/proxy_ temp的nginx缓存等,那么rm -rf *可能就不好使了,因为要等待很长一段时间。在这种情况下我们可以使用rsync来巧妙处理。rsync实际用的是替换原理
## 步骤
### 1. 建立一个空的文件夹并添加文件
mkdir /root/blank #空文件夹
mkdir /opt/test
cd /opt/test
touch 1..1000.txt #模拟大缓存文件
![34.png](https://s2.51cto.com/images/20220226/1645867694921541.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)
### 2. 用rsync删除目标目录
rsync --delete-before -a -H -v --progress --stats /root/blank/ /opt/test #这样目标目录很快就被清空了
ls /opt/test
![35.png](https://s2.51cto.com/images/20220226/1645867907382001.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)
![36.png](https://s2.51cto.com/images/20220226/1645867907793925.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)
以上是关于分布式文件系统和企业级应用 ——rsync远程同步的主要内容,如果未能解决你的问题,请参考以下文章