rsync也可以远程数据同步

Posted 寂寞的小丑

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了rsync也可以远程数据同步相关的知识,希望对你有一定的参考价值。

rsync简介

rsync(rem ote synchronize)是一个远程数据同步工具,可通过 LAN/WAN 快速同步多台主机之间的文件。也可以使用 rsync 同步本地硬盘中的不同目录。

rsync是用于替代rcp的一个工具,rsync 使用所谓的 rsync算法进行数据同步,这种算法只传送两个文件的不同部分,而不是每次都整份传送,因此速度非常快。

rsync支持大多数的类 Unix 系统,无论是 LinuxSolaris 还是 BSD上 都经过了良好的测试。 CentOS系统默认就安装了rsync软件包。 此外,在windows平台下也有相应的版本,如cwrsync

rsync特点

rsync 具有如下的基本特性:

  • 可以镜像保存整个目录树和文件系统
  • 可以很容易做到保持原来文件的权限、时间、软硬链接
  • 无须特殊权限即可安装
  • 优化的流程,文件传输效率高
  • 可以使用 rshssh 方式来传输文件,当然也可以通过直接的 socket 连接
  • 支持匿名传输,以方便进行网站镜象

在使用 rsync 进行远程同步时,可以使用两种方式:远程Shell方式(建议使用 ssh,用户验证由 ssh 负责)和C/S方式(即客户连接远程 rsync 服务器,用户验证由 rsync 服务器负责)。

无论本地同步目录还是远程同步数据,首次运行时将会把全部文件拷贝一次,以后再运行时将只拷贝有变化的文件(对于新文件)或文件的变化部分(对于原有文件)。rsync 在首次复制时没有速度优势,速度不如 tar,因此当数据量很大时您可以考虑先使用 tar 进行首次复制,然后再使用 rsync 进行数据同步。

镜像、备份和归档

实施备份的两种情况:

  • 需保留备份历史归档:在备份时保留历史的备份归档,是为了在系统出现错误后能恢复到从前正确的状态。这可以使用完全备份增量备份来完成。
    • 可以使用 tar 命令保存归档文件。
    • 为了提高备份效率,也可以使用 rsync 结合 tar 来完成。
  • 无需保留备份历史归档:若无需从历史备份恢复到正确状态,则只备份系统最“新鲜”的状态即可。这可以简单地使用 rsync 同步来完成。此时通常称为镜像。镜像可以分为两种:
    • 被镜像的目录在各个主机上保持相同的位置。此时一般是为了实施负载均衡而对多个主机进行同步镜像。例如:将主机A的/srv/www 目录同步到主机B的/srv/www目录等。
    • 被镜像的目录在各个主机上不保持相同的位置。例如:主机 A 和主机 B 都运行着各自的业务,同时又互为镜像备份。此时主机A的/srv/www目录同步到主机B的/back ups/hosta/www 目录;主机B的/srv/www目录同步到主机A的/back ups/hostb/www 目录等。

rsync命令

rsync是一个功能非常强大的工具,其命令也有很多功能选项。rsync的命令格式为:

1)本地使用:
rsync [OPTION...] SRC... [DEST]
2)通过远程 Shell 使用:
拉: rsync [OPTION...] [[email protected]]HOST:SRC... [DEST]
推: rsync [OPTION...] SRC... [[email protected]]HOST:DEST
3)访问 rsync 服务器:
拉: rsync [OPTION...] [[email protected]]HOST::SRC... [DEST]
推: rsync [OPTION...] SRC... [[email protected]]HOST::DEST
拉: rsync [OPTION...] rsync://[[email protected]]HOST[:PORT]/SRC... [DEST]
推: rsync [OPTION...] SRC... rsync://[[email protected]]HOST[:PORT]/DEST

其中:

  • SRC: 是要复制的源位置
  • DEST: 是复制目标位置
  • 若本地登录用户与远程主机上的用户一致,可以省略 [email protected]
  • 使用远程 shell 同步时,主机名与资源之间使用单个冒号“:”作为分隔符
  • 使用 rsync 服务器同步时,主机名与资源之间使用两个冒号“::”作为分隔符
  • 当访问 rsync 服务器时也可以使用 rsync://URL
  • “拉”复制是指从远程主机复制文件到本地主机
  • “推”复制是指从本地主机复制文件到远程主机
  • 当进行“拉”复制时,若指定一个 SRC 且省略 DEST,则只列出资源而不进行复制

下面列出常用选项:

选项说明
-a,--archive 归档模式,表示以递归方式传输文件,并保持所有文件属性,等价于 -rlptgoD (注意不包括 -H)
-r,--recursive 对子目录以递归模式处理
-l,--links 保持符号链接文件
-H,--hard-links 保持硬链接文件
-p,--perms 保持文件权限
-t,--times 保持文件时间信息
-g,--group 保持文件属组信息
-o,--owner 保持文件属主信息 (super-user only)
-D 保持设备文件和特殊文件 (super-user only)
-z,--compress 在传输文件时进行压缩处理
--exclude=PATTERN 指定排除一个不需要传输的文件匹配模式
--exclude-from=FILE 从FILE中读取排除规则
--include=PATTERN 指定需要传输的文件匹配模式
--include-from=FILE 从FILE中读取包含规则
--copy-unsafe-links 拷贝指向SRC路径目录树以外的链接文件
--safe-links 忽略指向SRC路径目录树以外的链接文件(默认)
--existing 仅仅更新那些已经存在于接收端的文件,而不备份那些新创建的文件
--ignore-existing 忽略那些已经存在于接收端的文件,仅备份那些新创建的文件
-b,--backup 当有变化时,对目标目录中的旧版文件进行备份
--backup-dir=DIR 与-b结合使用,将备份的文件存到 DIR 目录中
--link-dest=DIR 当文件未改变时基于 DIR 创建硬链接文件
--delete 删除那些接收端还有而发送端已经不存在的文件
--delete-before 接收者在传输之前进行删除操作 (默认)
--delete-during 接收者在传输过程中进行删除操作
--delete-after 接收者在传输之后进行删除操作
--delete-excluded 在接收方同时删除被排除的文件
-e,--rsh=COMMAND 指定替代 rsh 的 shell 程序
--ignore-errors 即使出现 I/O 错误也进行删除
--partial 保留那些因故没有完全传输的文件,以是加快随后的再次传输
--progress 在传输时显示传输过程
-P 等价于--partial--progress
--delay-updates 将正在更新的文件先保存到一个临时目录(默认为 “.~tmp~”),待传输完毕再更新目标文件
-v,--verbose 详细输出模式
-q,--quiet 精简输出模式
-h,--human-readable 输出文件大小使用易读的单位(如,K,M等)
-n,--dry-run 显示哪些文件将被传输
--list-only 仅仅列出文件而不进行复制
--rsync-path=PROGRAM 指定远程服务器上的 rsync 命令所在路径
--password-file=FILE 从 FILE 中读取口令,以避免在终端上输入口令,通常在 cron 中连接 rsync 服务器时使用
-4,--ipv4 使用 IPv4
-6,--ipv6 使用 IPv6
--version 打印版本信息
--help 显示帮助信息

若使用普通用户身份运行rsync命令,同步后的文件的属主将改变为这个普通用户身份。

若使用超级用户身份运行rsync命令,同步后的文件的属主将保持原来的用户身份。

rsync的基本使用

在本地磁盘同步数据

# rsync -a --delete /home /backups
# rsync -a --delete /home/ /backups/home.0

在指定复制源时,路径是否有最后的 “/” 有不同的含义,例如:

  • /home: 表示将整个 /home 目录复制到目标目录
  • /home/:表示将 /home 目录中的所有内容复制到目标目录

使用基于ssh的rsync远程同步数据

1、同步静态主机表文件

# 执行“推”复制同步(centos5 是可解析的远程主机名)
[[email protected] ~]# rsync /etc/hosts centos5:/etc/hosts
# 执行“拉”复制同步(soho 是可解析的远程主机名)
[[email protected] ~]# rsync soho:/etc/hosts /etc/hosts

2、同步用户的环境文件

# 执行“推”复制同步
[[email protected] ~]$ rsync ~/.bash* centos5:
# 执行“拉”复制同步
[[email protected] ~]$ rsync soho:~/.bash* .

3、同步站点根目录

# 执行“推”复制同步
[[email protected] ~]$ rsync -avz --delete /var/www [email protected]:/var/www
# 执行“拉”复制同步
[[email protected] ~]$ rsync -avz --delete [email protected]:/var/www /var/www
  • 使用基于 ssh 的 rsync 同步数据可以使用 -essh 参数,当前的 CentOS 默认指定使用 ssh 作为远程 Shell。若您在其他系统上执行 rsync 命令,为确保使用 ssh 作为远程 Shell,请添加 -essh 参数。
  • 通常 rsync 命令在后台以 cron 任务形式执行,为了避免从终端上输入口令需要设置 ssh。ssh 的设置方法请参考安全登录守护进程

使用--exclude/--include选项

可以使用--exclude 选项排除源目录中要传输的文件;同样地,也可以使用--include 选项指定要传输的文件。

例如:下面的 rsync 命令将 192.168.0.101 主机上的 /www 目录(不包含 /www/logs 和 /www/conf 子目录)复制到本地的/back up/www/ 。

# rsync -vzrtopg --delete --exclude "logs/" --exclude "conf/" --progress [email protected]:/www/ /backup/www/

又如:下面的rsync命令仅复制目录结构而忽略掉目录中的文件。

# rsync -av --include ‘*/‘ --exclude ‘*‘ [email protected]:/www/ /backup/www-tree/

选项--include 和--exclude 都不能使用间隔符。例如:

--exclude "logs/" --exclude "conf/"

不能写成

--exclude "logs/ conf/"

以上是关于rsync也可以远程数据同步的主要内容,如果未能解决你的问题,请参考以下文章

linux rsync远程同步+sersync+rsync实现实时同步

rsync+inotify实时同步环境部署

rsync远程同步及rsync+inotify实时同步

Rsync本地及远程同步工具

十rsync+inotify的使用

rsync+inotify自动同步