分布式文件系统—FastDFS

Posted Doker 多克

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了分布式文件系统—FastDFS相关的知识,希望对你有一定的参考价值。

 一、概述

FastDFS是一个开源的高性能分布式文件系统。其主要 功能包括:文件存储、文件同步和文件访问(文件上传) 和文件下载),并且可以解决高容量和负载平衡 问题。FastDFS应满足其服务基础网站的要求 在照片共享站点和视频共享站点等文件上。

FastDFS有两个角色:跟踪器和存储。跟踪器负责 文件访问的计划和负载平衡。存储存储文件及其 功能是文件管理,包括:文件存储,文件同步,提供文件 访问接口。它还管理元数据,这些数据是代表属性的属性 作为文件的键值对。例如:width=1024,键为“width”和 值为“1024”。

跟踪器和存储包含一个或多个服务器。跟踪器中的服务器 或者可以随时将存储集群添加到集群或从集群中删除,而无需 影响在线服务。跟踪器集群中的服务器是对等的。

按文件卷/组组织以获得高容量的 storarge 服务器。 存储系统包含一个或多个卷,其文件独立于 这些卷。整个存储系统的容量等于所有存储系统的总和 卷的容量。文件卷包含一个或多个存储服务器,其文件 在这些服务器之间是相同的。文件卷中的服务器相互备份, 所有这些服务器都是负载平衡的。将存储服务器添加到 卷,此卷中已存在的文件将复制到此新服务器 自动,复制完成后,系统将切换此服务器 在线提供存储服务。

当整个存储容量不足时,可以添加一个或多个 卷以扩展存储容量。为此,您需要添加一个或 更多存储服务器。

文件的标识由两部分组成:卷名和 文件名。

1、FastDFS整体架构

FastDFS文件系统由两大部分构成,一个是客户端,一个是服务端

客户端通常指我们的程序,比如我们的Java程序去连接FastDFS、操作FastDFS,那我们的Java程序就是一个客户端,FastDFS提供专有API访问,目前提供了C、Java和php几种编程语言的API,用来访问FastDFS文件系统。

服务端由两个部分构成:一个是跟踪器(tracker),一个是存储节点(storage)

tracker跟踪器主要做调度工作,起到均衡的作用;负责管理所有的 storage server和 group,每个 storage 在启动后会连接 tracker,告知自己所属 group 等信息,并保持周期性心跳。tracker记录group以及每个group的存储信息。在内存中记录集群中存储节点storage的状态信息,是前端Client和后端存储节点storage的枢纽。因为相关信息全部在内存中,Tracker server的性能非常高,一个较大的集群(比如上百个group)中有3台就足够了。

storage存储节点主要提供存储文件和备份服务;以 group 为单位,每个 group 内可以有多台 storage server,数据互为备份。存储文件和文件属性(meta data)都保存到存储服务器磁盘上,完成文件管理的所有功能:文件存储、文件同步和提供文件访问等。group内每个storage的存储依赖于本地文件系统,storage可配置多个数据存储目录,比如有10块磁盘,分别对应在/data/disk1-/data/disk10,则可将这10个目录都配置为storage的数据存储目录

按文件卷/组组织以获得高容量的 storarge 服务器。 存储系统包含一个或多个卷,其文件独立于 这些卷。整个存储系统的容量等于所有存储系统的总和 卷的容量。文件卷包含一个或多个存储服务器,其文件 在这些服务器之间是相同的。文件卷中的服务器相互备份, 所有这些服务器都是负载平衡的。将存储服务器添加到 卷,此卷中已存在的文件将复制到此新服务器 自动,复制完成后,系统将切换此服务器 在线提供存储服务。

当整个存储容量不足时,可以添加一个或多个 卷以扩展存储容量。为此,您需要添加一个或 更多存储服务器。

2、使用的系统软件

名称说明
centos7.x
libfastcommonFastDFS分离出的公用函数库
libserverframeFastDFS分离出的网络框架
FastDFSFastDFS本体
fastdfs-nginx-moduleFastDFS和nginx的关联模块
nginxnginx1.15.4

FastDFS下载地址:https://sourceforge.net/projects/fastdfs/

FastDFS的github下载地址:https://github.com/happyfish100/fastdfs

libfastcommon的下载地址:https://sourceforge.net/projects/libfastcommon/

libfastcommon的github下载地址:https://github.com/happyfish100/libfastcommon

FastDFS-nginx-module的github下载地址:GitHub - happyfish100/fastdfs-nginx-module: FastDFS nginx module

二、部署

FastDFS分布式文件系统

摘要: FastDFS简介 ?FastDFS是一个轻量级的开源分布式文件系统 ?FastDFS主要解决了大容量的文件存储和高并发访问的问题,文件存取时实现了负载均衡 ?FastDFS实现了软件方式的RAID,可以使用廉价的IDE硬盘进行存储 ?支持存储服务器在线扩容 ?支持相同内容的文件只保存一份,节约磁盘空间

FastDFS简介

?FastDFS是一个轻量级的开源分布式文件系统

?FastDFS主要解决了大容量的文件存储和高并发访问的问题,文件存取时实现了负载均衡

?FastDFS实现了软件方式的RAID,可以使用廉价的IDE硬盘进行存储

?支持存储服务器在线扩容

?支持相同内容的文件只保存一份,节约磁盘空间

?FastDFS只能通过ClientAPI访问,不支持POSIX访问方式

?FastDFS特别适合大中型网站使用,用来存储资源文件(如:图片、文档、音频、视频等等)

系统架构-架构图

系统架构-上传文件流程图

? 1. client询问tracker上传到的storage,不需要附加参数;

? 2. tracker返回一台可用的storage;

? 3. client直接和storage通讯完成文件上传。

系统架构-下载文件流程图

? 1. client询问tracker下载文件的storage,参数为文件标识(组名和文件名);

? 2. tracker返回一台可用的storage;

? 3. client直接和storage通讯完成文件下载。

相关术语

? Tracker Server:跟踪服务器,主要做调度工作,在访问上起负载均衡的作用。记录storage server的状态,是连接Client和Storageserver的枢纽。

? Storage Server:存储服务器,文件和meta data都保存到存储服务器上

? group:组,也可称为卷。同组内服务器上的文件是完全相同的

? 文件标识:包括两部分:组名和文件名(包含路径)

? meta data:文件相关属性,键值对(Key Value Pair)方式,如:width=1024,heigth=768

同步机制

?同一组内的storageserver之间是对等的,文件上传、删除等操作可以在任意一台storage server上进行;

?文件同步只在同组内的storage server之间进行,采用push方式,即源服务器同步给目标服务器;

?源头数据才需要同步,备份数据不需要再次同步,否则就构成环路了;

?上述第二条规则有个例外,就是新增加一台storage server时,由已有的一台storageserver将已有的所有数据(包括源头数据和备份数据)同步给该新增服务器。

通信协议

? 协议包由两部分组成:header和body

? header共10字节,格式如下:

– 8 bytes body length

– 1 byte command

– 1 byte status

? body数据包格式由取决于具体的命令,body可以为空

运行时目录结构-tracker server

?  ${base_path}

|__data

|     |__storage_groups.dat:存储分组信息

|    |__storage_servers.dat:存储服务器列表

|__logs

|__trackerd.log:trackerserver日志文件

运行时目录结构-storage server

?  ${base_path}

|__data

|     |__.data_init_flag:当前storageserver初始化信息

|    |__storage_stat.dat:当前storage server统计信息

|    |__sync:存放数据同步相关文件

|    |     |__binlog.index:当前的binlog文件索引号

|    |     |__binlog.###:存放更新操作记录(日志)

|    |     |__${ip_addr}_${port}.mark:存放同步的完成情况

|    |

|     |__一级目录:256个存放数据文件的目录,如:00, 1F

|           |__二级目录:256个存放数据文件的目录

|__logs

|__storaged.log:storageserver日志文件

安装和运行

?#step 1. download FastDFS source package and unpack it,

?# if you use HTTP to download file, please downloadlibevent 1.4.x and install it

?tar xzf FastDFS_v1.x.tar.gz

?#for example:

?tar xzf FastDFS_v1.20.tar.gz

?

?#step 2. enter the FastDFS dir

?cd FastDFS

?

?#step 3. if HTTP supported, modify make.sh, uncommentthe line:

?# WITH_HTTPD=1, then execute:

?./make.sh

?

?#step 4. make install

?./make.sh install

?

?#step 5. edit/modify the config file of tracker andstorage

?

?#step 6. run server programs

?#start the tracker server:

?/usr/local/bin/fdfs_trackerd

?

?#start the storage server:

?/usr/local/bin/fdfs_storaged

FastDFS和集中存储方式对比

 

技术分享

 

? FastDFS中文:http://www.csource.org/

? FastDFS英文:http://code.google.com/p/fastdfs/

官网资料,分享给大家学习

愿意了解框架技术或者源码的朋友直接加求求(企鹅):2042849237

更多详细源码参考来源:http://minglisoft.cn/technology

 

以上是关于分布式文件系统—FastDFS的主要内容,如果未能解决你的问题,请参考以下文章

fastdfs分布式文件系统之与dubbo整合实现分布式服务接口

分布式搭建-简易版文件上传下载服务器FastDFS

FastDfs 分布式文件系统 (实测成功)

分布式文件服务器FastDFS之“文件上传后(JAVA),前(AngularJS)端代码"

分布式文件系统 fastdfs

从入门到精通(分布式文件系统架构)-FastDFS,FastDFS-Nginx整合,合并存储,存储缩略图,图片压缩,Java客户端