Linux(Ubuntu)搭建FastDFS文件管理系统
Posted toplabs
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Linux(Ubuntu)搭建FastDFS文件管理系统相关的知识,希望对你有一定的参考价值。
文章目录
- 1 前言
- 1.1 `FastDFS`是什么
- 1.2 `FastDFS`结构
- 1.3 `FastDFS`的存储策略
- 1.4 `FastDFS`的上传过程
- 1.5 `FastDFS`的文件同步
- 1.6 `FastDFS`的文件下载
- 2 搭建`FastDFS`文件服务器
- 2.1 准备
- 2.2 安装C/C++编译环境
- 2.3 下载安装libfastcommon
- 2.4 下载安装FastDFS
- 2.5 配置FastDFS跟踪器(Tracker)
- 2.6 配置FastDFS存储(Storage)
- 2.7 文件上传测试
- 3 安装Nginx
- 3.1 安装Nginx所需环境
- 3.2 访问文件
- 4 FastDFS配置Nginx模块
- 4.1 安装配置Nginx模块
1 前言
FastDFS
开源地址: https://github.com/happyfish100
1.1 FastDFS
是什么
FastDFS
是阿里余庆用C语言
编写的一款开源的分布式文件系统。FastDFS
为互联网量身定制,充分考虑了冗余备份、负载均衡、线性扩容等机制,并注重高可用、高性能等指标,使用FastDFS
很容易搭建一套高性能的文件服务器集群提供文件上传、下载等服务。
1.2 FastDFS
结构
FastDFS
系统有三个角色: 跟踪服务器(Tracker Server
)、存储服务器(Storage Server
)和客户端(Client
)。客户端请求Tracker server
进行文件上传、下载,通过Tracker Server
调度最终由Storage Server
完成文件上传和下载。
Tracker Server作用是负载均衡和调度,负责管理所有的Storage Server
和group
,每个Storage
在启动后会连接Tracker Server
,告知自己所属group
等信息,并保持周期性心跳。通过Tracker Server
在文件上传时可以根据一些策略找到Storage Server
提供文件上传服务。可以将Tracker`称为追踪服务器或调度服务器。
Storage Server作用是文件存储,主要提供容量和备份服务;以group
为单位,每个group
内可以有多台 Storage Server
,数据互为备份。客户端上传的文件最终存储在Storage
服务器上,Storage Server
没有实现自己的文件系统而是利用操作系统的文件系统来管理文件。可以将Storage
称为存储服务器。
Client是上传下载数据的服务器,也就是我们自己的项目所部署在的服务器,称为客户端。
1.3 FastDFS
的存储策略
为了支持大容量,存储节点(服务器)采用了分卷(或分组)的组织方式。存储系统由一个或多个卷组成,卷与卷之间的文件是相互独立的,所有卷的文件容量累加就是整个存储系统中的文件容量。一个卷可以由一台或多台存储服务器组成,一个卷下的存储服务器中的文件都是相同的,卷中的多台存储服务器起到了冗余备份和负载均衡的作用。
在卷中增加服务器时,同步已有的文件由系统自动完成,同步完成后,系统自动将新增服务器切换到线上提供服务。当存储空间不足或即将耗尽时,可以动态添加卷。只需要增加一台或多台服务器,并将它们配置为一个新的卷,这样就扩大了存储系统的容量。
1.4 FastDFS
的上传过程
FastDFS
向使用者提供基本文件访问接口,比如upload、download、append、delete等,以客户端库的方式提供给用户使用。
Storage Server会定期的向Tracker Server发送自己的存储信息。当Tracker Server Cluster中的Tracker Server不止一个时,各个Tracker之间的关系是对等的,所以客户端上传时可以选择任意一个Tracker。
当Tracker收到客户端上传文件的请求时,会为该文件分配一个可以存储文件的group,当选定了group后就要决定给客户端分配group中的哪一个Storage Server。当分配好Storage Server后,客户端向Storage发送写文件请求,Storage将会为文件分配一个数据存储目录。然后为文件分配一个file_id,最后根据以上的信息生成文件名存储文件。
1.5 FastDFS
的文件同步
写文件时,客户端将文件写至group内一个Storage Server即认为写文件成功,Storage Server写完文件后,会由后台线程将文件同步至同group内其他的Storage Server。
每个Storage写文件后,同时会写一份bin_log,bin_log里不包含文件数据,只包含文件名等元信息,这份bin_log用于后台同步,Storage会记录向group内其他Storage同步的进度,以便重启后能接上次的进度继续同步;进度以时间戳的方式进行记录,所以最好能保证集群内所有server的时钟保持同步。
Storage的同步进度会作为元数据的一部分汇报到tracker上,tracker在选择读Storage的时候会以同步进度作为参考。
1.6 FastDFS
的文件下载
客户端upload file成功后,会拿到一个Storage生成的文件名,接下来客户端根据这个文件名即可访问到该文件。
跟upload file一样,在download file时客户端可以选择任意Tracker Server。tracker发送download请求给某个tracker,必须带上文件名信息,tracker从文件名中解析出文件的group、大小、创建时间等信息,然后为该请求选择一个Storage用来服务读请求。
2 搭建FastDFS文件服务器
2.1 准备
- 操作环境:Ubuntu20 X64,以下操作都是单机环境。
- 修改hosts,将文件服务器的IP与域名映射(单机Tracker Server环境),因为后面很多配置里面都需要去配置服务器地址,IP变了,就只需要修改hosts即可。
vim /etc/hosts
# 增加如下一行,这是我的IP,如果是云端服务器,需要填写公网IP地址
192.168.137.1 file.toplabs.com
# 如果要本机访问虚拟机,在C:\\Windows\\System32\\drivers\\etc\\hosts中同样增加一行
2.2 安装C/C++编译环境
sudo apt install g++
sudo apt install make
2.3 下载安装libfastcommon
libfastcommon
是从FastDFS
和FastDHT
中提取出来的公共C函数
库,基础环境,安装即可。
- 下载
libfastcommon
cd /usr/local/fastdfs # fastdfs是自己创建的目录
wget https://github.com/happyfish100/libfastcommon/archive/V1.0.43.tar.gz
- 解压
tar -zxvf V1.0.43.tar.gz
- 编译、安装
cd libfastcommon-1.0.43
./make.sh
./make.sh install
2.4 下载安装FastDFS
- 下载FastDFS
cd /usr/local/fastdfs
wget https://github.com/happyfish100/fastdfs/archive/V6.06.tar.gz
- 解压
tar -zxvf V6.06.tar.gz
- 编译、安装
cd fastdfs-6.06
./make.sh
./make.sh install
- 复制
FastDFS
的部分配置文件到/etc/fdfs
目录
cd conf/
cp http.conf mime.types /etc/fdfs/
2.5 配置FastDFS跟踪器(Tracker)
- 进入
/etc/fdfs
,复制FastDFS
跟踪器样例配置文件tracker.conf.sample
,并重命名为tracker.conf
。
cd /etc/fdfs
cp tracker.conf.sample tracker.conf
vim tracker.conf
- 编辑
tracker.conf
,修改如下配置,其它的默认即可。
# 提供服务的端口
port=22122
# Tracker 数据和日志目录地址(根目录必须存在,子目录会自动创建)
base_path=/toplabs/fastdfs/tracker
# HTTP 服务端口
http.server_port=80
- 创建tracker基础数据目录,即base_path对应的目录
mkdir -p /toplabs/fastdfs/tracker
- 防火墙中打开跟踪端口(默认的22122)
ufw allow 22122
- 启动Tracker
/etc/init.d/fdfs_trackerd start
查看 Tracker 是否已成功启动,22122端口正在被监听,则算是Tracker服务安装成功。
[root@localhost ~]# netstat -unltp | grep fdfs
tcp 0 0 0.0.0.0:22122 0.0.0.0:* LISTEN 140436/fdfs_tracker
关闭Tracker命令:
/etc/init.d/fdfs_trackerd stop
- 设置Tracker开机启动
vim /etc/rc.local
# 加入配置:
/etc/init.d/fdfs_trackerd start
- tracker server 目录及文件结构
Tracker服务启动成功后,会在base_path下创建data、logs两个目录。目录结构如下:
/toplabs/fastdfs/tracker/
├── data
│ ├── fdfs_trackerd.pid
│ └── storage_changelog.dat
└── logs
└── trackerd.log
2.6 配置FastDFS存储(Storage)
- 进入
/etc/fdfs
目录,复制FastDFS
存储器样例配置文件storage.conf.sample
,并重命名为storage.conf
cd /etc/fdfs
cp storage.conf.sample storage.conf
vim storage.conf
- 编辑
storage.conf
,修改如下配置,其它的默认即可。
# storage server 服务端口
port=23000
# Storage 数据和日志目录地址(根目录必须存在,子目录会自动生成)
base_path=/toplabs/fastdfs/storage
# 如果不配置 store_path0,那它就和 base_path 对应的路径一样。
store_path0=/toplabs/fastdfs/file
# tracker_server 的列表 ,会主动连接 tracker_server
# 有多个 tracker server 时,每个 tracker server 写一行
tracker_server=file.toplabs.com:22122
# 访问端口
http.server_port=80
- 创建Storage基础数据目录,对应base_path目录
mkdir -p /toplabs/fastdfs/storage
# 这是配置的store_path0路径
mkdir -p /toplabs/fastdfs/file
- 防火墙中打开存储器端口(默认23000)
ufw allow 23000
- 启动 Storage
/etc/init.d/fdfs_storaged start
查看Storage是否成功启动,23000端口正在被监听,就算Storage启动成功。
[root@localhost ~]# netstat -unltp | grep fdfs
tcp 0 0 0.0.0.0:22122 0.0.0.0:* LISTEN 140436/fdfs_tracker
tcp 0 0 0.0.0.0:23000 0.0.0.0:* LISTEN 140457/fdfs_storage
关闭Storage命令:
/etc/init.d/fdfs_storaged stop
查看Storage和Tracker是否在通信:
/usr/bin/fdfs_monitor /etc/fdfs/storage.conf
6. 设置 Storage 开机启动
vim /etc/rc.local
# 加入配置:
/etc/init.d/fdfs_storaged start
- Storage 目录
同 Tracker,Storage启动成功后,在base_path下创建了data、logs目录,记录着Storage Server 的信息。
/toplabs/fastdfs/storage/
├── data
│ ├── fdfs_storaged.pid
│ ├── storage_stat.dat
│ └── sync
│ ├── binlog.000
│ └── binlog_index.dat
└── logs
└── storaged.log
在 store_path0 目录下,创建了N*N个子目录:
[root@localhost ~]# ls /toplabs/fastdfs/file/data/
00 0B 16 21 2C 37 42 4D 58 63 6E 79 84 8F 9A A5 B0 BB C6 D1 DC E7 F2 FD
01 0C 17 22 2D 38 43 4E 59 64 6F 7A 85 90 9B A6 B1 BC C7 D2 DD E8 F3 FE
02 0D 18 23 2E 39 44 4F 5A 65 70 7B 86 91 9C A7 B2 BD C8 D3 DE E9 F4 FF
03 0E 19 24 2F 3A 45 50 5B 66 71 7C 87 92 9D A8 B3 BE C9 D4 DF EA F5
04 0F 1A 25 30 3B 46 51 5C 67 72 7D 88 93 9E A9 B4 BF CA D5 E0 EB F6
05 10 1B 26 31 3C 47 52 5D 68 73 7E 89 94 9F AA B5 C0 CB D6 E1 EC F7
06 11 1C 27 32 3D 48 53 5E 69 74 7F 8A 95 A0 AB B6 C1 CC D7 E2 ED F8
07 12 1D 28 33 3E 49 54 5F 6A 75 80 8B 96 A1 AC B7 C2 CD D8 E3 EE F9
08 13 1E 29 34 3F 4A 55 60 6B 76 81 8C 97 A2 AD B8 C3 CE D9 E4 EF FA
09 14 1F 2A 35 40 4B 56 61 6C 77 82 8D 98 A3 AE B9 C4 CF DA E5 F0 FB
0A 15 20 2B 36 41 4C 57 62 6D 78 83 8E 99 A4 AF BA C5 D0 DB E6 F1 FC
2.7 文件上传测试
- 进入
/etc/fdfs
目录,复制FastDFS
存储器样例配置文件client.conf.sample
,并重命名为client.conf
cd /etc/fdfs
cp client.conf.sample client.conf
vim client.conf
- 编辑
client.conf
,修改如下配置,其它的默认即可。
# Client 的数据和日志目录
base_path=/toplabs/fastdfs/client
# Tracker端口
tracker_server=file.toplabs.com:22122
- 创建Storage基础数据目录,对应base_path目录
mkdir -p /toplabs/fastdfs/client
- 上传测试
在Linux内部执行如下命令上传/usr/local/fastdfs/fastdfs-6.06/images/architect.png
图片
fdfs_upload_file /etc/fdfs/client.conf /usr/local/fastdfs/fastdfs-6.06/images/architect.png
上传成功后返回文件ID号: group1/M00/00/00/wKgALl_DpGeAOoAyAAYB1ymW77M906.png
返回的文件ID由group、存储目录、两级子目录、file_id、文件后缀名(由客户端指定,主要用于区分文件类型)拼接而成。
文件存在了哪里呢?这里/toplabs/fastdfs/file/data/00/00
其实到这一步,这个上传的文件的路径已经出来了。
http://file.toplabs.com/group1/M00/00/00/wKgALl_DpGeAOoAyAAYB1ymW77M906.png
但是在浏览器中还不能够直接访问文件。
3 安装nginx
上面将文件上传成功了,但我们无法访问。因此安装Nginx作为服务器以支持Http方式访问文件。
Nginx只需要安装到Storage Server所在的服务器即可,用于访问文件。我这里由于是单机,Tracker Server和Storage Server在一台服务器上。
3.1 安装Nginx所需环境
sudo apt install g++ # 前面已经安装过的,可以跳过
sudo apt install openssl libssl-dev
sudo apt install libpcre3 libpcre3-dev
sudo apt install zlib1g-dev
3.2 安装Nginx
- 下载
nginx
wget https://nginx.org/download/nginx-1.19.5.tar.gz
- 解压
tar -zxvf nginx-1.19.5.tar.gz
- 使用默认配置
cd nginx-1.19.5
./configure
- 编译、安装
make
make install
- 启动
nginx
cd /usr/local/nginx/sbin/
./nginx
# 有可能会报错,上面显示找不到logs文件
mkdir ../logs
# 其它命令
./nginx -s stop
./nginx -s quit
./nginx -s reload
- 设置开机启动
vim /etc/rc.local
# 添加一行:
/usr/local/nginx/sbin/nginx
- 防火墙中打开Nginx端口(默认80)
ufw allow 80
3.2 访问文件
简单的测试访问文件
- 修改
nginx.conf
vim /usr/local/nginx/conf/nginx.conf
# 添加如下行,将 /group1/M00 映射到 /toplabs/fastdfs/file/data
location /group1/M00
alias /toplabs/fastdfs/file/data;
#重启nginx
/usr/local/nginx/sbin/nginx -s reload
- 在浏览器访问之前上传的图片、成功。
4 FastDFS配置Nginx模块
4.1 安装配置Nginx模块
-
fastdfs-nginx-module
模块说明
FastDFS
通过Tracker服务器,将文件放在Storage服务器存储,但是同组存储服务器之间需要进行文件复制,有同步延迟的问题。
假设Tracker服务器将文件上传到了192.168.137.1
,上传成功后文件ID已经返回给客户端。
此时FastDFS
存储集群机制会将这个文件同步到同组存储192.168.137.2
,在文件还没有复制完成的情况下,客户端如果用这个文件ID在192.168.137.2
上取文件,就会出现文件无法访问的错误。
而fastdfs-nginx-module
可以重定向文件链接到源服务器取文件,避免客户端由于复制延迟导致的文件无法访问错误。
- 下载
fastdfs-nginx-module
、解压、重命名
# 下载
wget https://github.com/happyfish100/fastdfs-nginx-module/archive/V1.22.tar.gz
# 解压
tar -zxvf V1.22.tar.gz
# 重命名
mv fastdfs-nginx-module-1.22/ fastdfs-nginx-module
- 配置
nginx
,在nginx
中添加模块
# 先停掉nginx服务
/usr/local/nginx/sbin/nginx -s stop
# 进入nginx目录
cd /usr/local/nginx/
# 添加模块,后面填写自己的解压路径
./configure --add-module=/usr/local/fastdfs/fastdfs-nginx-module/src
# 重新编译、安装
make && make install
- 查看Nginx的模块
[root@localhost ~]# usr/local/nginx/sbin/nginx -V
nginx version: nginx/1.19.5
built by gcc 9.3.0 (Ubuntu 9.3.0-17ubuntu1~20.04)
# 有下面这个就说明添加模块成功
configure arguments: --add-module=/usr/local/fastdfs/fastdfs-nginx-module/src
- 复制
fastdfs-nginx-module
源码中的配置文件到/etc/fdfs
目录
cd /usr/local/fastdfs/fastdfs-nginx-module/src
cp mod_fastdfs.conf /etc/fdfs/
cd /etc/fdfs
vim mod_fastdfs.conf
- 修改如下配置,其它默认
# 连接超时时间
connect_timeout=10
# Tracker Server
tracker_server=file.toplaabs.com:22122
# StorageServer 默认端口
storage_server_port=23000
# 如果文件ID的uri中包含/group**,则要设置为true
url_have_group_name = true
# Storage 配置的store_path0路径,必须和storage.conf中的一致
store_path0=/toplabs/fastdfs/file
- 配置
nginx
,修改nginx.conf
vim /usr/local/nginx/conf/nginx.conf
修改配置,其它的默认
在80端口下添加fastdfs-nginx
模块
location ~/group([0-9])/M00
ngx_fastdfs_module;
注意:
listen 80端口值是要与/etc/fdfs/storage.conf
中的http.server_port=80
相对应。如果改成其它端口,则需要统一,同时在防火墙中打开该端口。
location的配置,如果有多个group则配置location ~/group([0-9])/M00,没有则不用配group。
- 启动
nginx
/usr/local/nginx/sbin/nginx
打印处如下就算配置成功ngx_http_fastdfs_set pid=xxx
- 在地址栏访问
能下载文件就算安装成功。注意和第三点中直接使用nginx
路由访问不同的是,这里配置fastdfs-nginx-module
模块,可以重定向文件链接到源服务器取文件。
以上是关于Linux(Ubuntu)搭建FastDFS文件管理系统的主要内容,如果未能解决你的问题,请参考以下文章
07.Linux系统-Fastdfs分布式文件系统-互为主从配置搭建部署