分布式文件系统—FastDFS
Posted Doker 多克
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了分布式文件系统—FastDFS相关的知识,希望对你有一定的参考价值。
一、概述
FastDFS是一个开源的高性能分布式文件系统。其主要 功能包括:文件存储、文件同步和文件访问(文件上传) 和文件下载),并且可以解决高容量和负载平衡 问题。FastDFS应满足其服务基础网站的要求 在照片共享站点和视频共享站点等文件上。
FastDFS有两个角色:跟踪器和存储。跟踪器负责 文件访问的计划和负载平衡。存储存储文件及其 功能是文件管理,包括:文件存储,文件同步,提供文件 访问接口。它还管理元数据,这些数据是代表属性的属性 作为文件的键值对。例如:width=1024,键为“width”和 值为“1024”。
跟踪器和存储包含一个或多个服务器。跟踪器中的服务器 或者可以随时将存储集群添加到集群或从集群中删除,而无需 影响在线服务。跟踪器集群中的服务器是对等的。
按文件卷/组组织以获得高容量的 storarge 服务器。 存储系统包含一个或多个卷,其文件独立于 这些卷。整个存储系统的容量等于所有存储系统的总和 卷的容量。文件卷包含一个或多个存储服务器,其文件 在这些服务器之间是相同的。文件卷中的服务器相互备份, 所有这些服务器都是负载平衡的。将存储服务器添加到 卷,此卷中已存在的文件将复制到此新服务器 自动,复制完成后,系统将切换此服务器 在线提供存储服务。
当整个存储容量不足时,可以添加一个或多个 卷以扩展存储容量。为此,您需要添加一个或 更多存储服务器。
文件的标识由两部分组成:卷名和 文件名。
1、FastDFS整体架构
FastDFS文件系统由两大部分构成,一个是客户端,一个是服务端
客户端通常指我们的程序,比如我们的Java程序去连接FastDFS、操作FastDFS,那我们的Java程序就是一个客户端,FastDFS提供专有API访问,目前提供了C、Java和php几种编程语言的API,用来访问FastDFS文件系统。
服务端由两个部分构成:一个是跟踪器(tracker),一个是存储节点(storage)
tracker跟踪器主要做调度工作,起到均衡的作用;负责管理所有的 storage server和 group,每个 storage 在启动后会连接 tracker,告知自己所属 group 等信息,并保持周期性心跳。tracker记录group以及每个group的存储信息。在内存中记录集群中存储节点storage的状态信息,是前端Client和后端存储节点storage的枢纽。因为相关信息全部在内存中,Tracker server的性能非常高,一个较大的集群(比如上百个group)中有3台就足够了。
storage存储节点主要提供存储文件和备份服务;以 group 为单位,每个 group 内可以有多台 storage server,数据互为备份。存储文件和文件属性(meta data)都保存到存储服务器磁盘上,完成文件管理的所有功能:文件存储、文件同步和提供文件访问等。group内每个storage的存储依赖于本地文件系统,storage可配置多个数据存储目录,比如有10块磁盘,分别对应在/data/disk1-/data/disk10,则可将这10个目录都配置为storage的数据存储目录
按文件卷/组组织以获得高容量的 storarge 服务器。 存储系统包含一个或多个卷,其文件独立于 这些卷。整个存储系统的容量等于所有存储系统的总和 卷的容量。文件卷包含一个或多个存储服务器,其文件 在这些服务器之间是相同的。文件卷中的服务器相互备份, 所有这些服务器都是负载平衡的。将存储服务器添加到 卷,此卷中已存在的文件将复制到此新服务器 自动,复制完成后,系统将切换此服务器 在线提供存储服务。
当整个存储容量不足时,可以添加一个或多个 卷以扩展存储容量。为此,您需要添加一个或 更多存储服务器。
2、使用的系统软件
名称 | 说明 |
---|---|
centos | 7.x |
libfastcommon | FastDFS分离出的公用函数库 |
libserverframe | FastDFS分离出的网络框架 |
FastDFS | FastDFS本体 |
fastdfs-nginx-module | FastDFS和nginx的关联模块 |
nginx | nginx1.15.4 |
FastDFS下载地址:https://sourceforge.net/projects/fastdfs/
FastDFS的github下载地址:https://github.com/happyfish100/fastdfs
libfastcommon的下载地址:https://sourceforge.net/projects/libfastcommon/
libfastcommon的github下载地址:https://github.com/happyfish100/libfastcommon
FastDFS-nginx-module的github下载地址:GitHub - happyfish100/fastdfs-nginx-module: FastDFS nginx module
二、部署
FastDFS分布式文件系统
摘要: FastDFS简介 ?FastDFS是一个轻量级的开源分布式文件系统 ?FastDFS主要解决了大容量的文件存储和高并发访问的问题,文件存取时实现了负载均衡 ?FastDFS实现了软件方式的RAID,可以使用廉价的IDE硬盘进行存储 ?支持存储服务器在线扩容 ?支持相同内容的文件只保存一份,节约磁盘空间
FastDFS简介
?FastDFS是一个轻量级的开源分布式文件系统
?FastDFS主要解决了大容量的文件存储和高并发访问的问题,文件存取时实现了负载均衡
?FastDFS实现了软件方式的RAID,可以使用廉价的IDE硬盘进行存储
?支持存储服务器在线扩容
?支持相同内容的文件只保存一份,节约磁盘空间
?FastDFS只能通过ClientAPI访问,不支持POSIX访问方式
?FastDFS特别适合大中型网站使用,用来存储资源文件(如:图片、文档、音频、视频等等)
系统架构-架构图
系统架构-上传文件流程图
? 1. client询问tracker上传到的storage,不需要附加参数;
? 2. tracker返回一台可用的storage;
? 3. client直接和storage通讯完成文件上传。
系统架构-下载文件流程图
? 1. client询问tracker下载文件的storage,参数为文件标识(组名和文件名);
? 2. tracker返回一台可用的storage;
? 3. client直接和storage通讯完成文件下载。
相关术语
? Tracker Server:跟踪服务器,主要做调度工作,在访问上起负载均衡的作用。记录storage server的状态,是连接Client和Storageserver的枢纽。
? Storage Server:存储服务器,文件和meta data都保存到存储服务器上
? group:组,也可称为卷。同组内服务器上的文件是完全相同的
? 文件标识:包括两部分:组名和文件名(包含路径)
? meta data:文件相关属性,键值对(Key Value Pair)方式,如:width=1024,heigth=768
同步机制
?同一组内的storageserver之间是对等的,文件上传、删除等操作可以在任意一台storage server上进行;
?文件同步只在同组内的storage server之间进行,采用push方式,即源服务器同步给目标服务器;
?源头数据才需要同步,备份数据不需要再次同步,否则就构成环路了;
?上述第二条规则有个例外,就是新增加一台storage server时,由已有的一台storageserver将已有的所有数据(包括源头数据和备份数据)同步给该新增服务器。
通信协议
? 协议包由两部分组成:header和body
? header共10字节,格式如下:
– 8 bytes body length
– 1 byte command
– 1 byte status
? body数据包格式由取决于具体的命令,body可以为空
运行时目录结构-tracker server
? ${base_path}
|__data
| |__storage_groups.dat:存储分组信息
| |__storage_servers.dat:存储服务器列表
|__logs
|__trackerd.log:trackerserver日志文件
运行时目录结构-storage server
? ${base_path}
|__data
| |__.data_init_flag:当前storageserver初始化信息
| |__storage_stat.dat:当前storage server统计信息
| |__sync:存放数据同步相关文件
| | |__binlog.index:当前的binlog文件索引号
| | |__binlog.###:存放更新操作记录(日志)
| | |__${ip_addr}_${port}.mark:存放同步的完成情况
| |
| |__一级目录:256个存放数据文件的目录,如:00, 1F
| |__二级目录:256个存放数据文件的目录
|__logs
|__storaged.log:storageserver日志文件
安装和运行
?#step 1. download FastDFS source package and unpack it,
?# if you use HTTP to download file, please downloadlibevent 1.4.x and install it
?tar xzf FastDFS_v1.x.tar.gz
?#for example:
?tar xzf FastDFS_v1.20.tar.gz
?
?#step 2. enter the FastDFS dir
?cd FastDFS
?
?#step 3. if HTTP supported, modify make.sh, uncommentthe line:
?# WITH_HTTPD=1, then execute:
?./make.sh
?
?#step 4. make install
?./make.sh install
?
?#step 5. edit/modify the config file of tracker andstorage
?
?#step 6. run server programs
?#start the tracker server:
?/usr/local/bin/fdfs_trackerd
?
?#start the storage server:
?/usr/local/bin/fdfs_storaged
FastDFS和集中存储方式对比
? FastDFS中文:http://www.csource.org/
? FastDFS英文:http://code.google.com/p/fastdfs/
官网资料,分享给大家学习
愿意了解框架技术或者源码的朋友直接加求求(企鹅):2042849237
更多详细源码参考来源:http://minglisoft.cn/technology
以上是关于分布式文件系统—FastDFS的主要内容,如果未能解决你的问题,请参考以下文章
fastdfs分布式文件系统之与dubbo整合实现分布式服务接口
分布式文件服务器FastDFS之“文件上传后(JAVA),前(AngularJS)端代码"
从入门到精通(分布式文件系统架构)-FastDFS,FastDFS-Nginx整合,合并存储,存储缩略图,图片压缩,Java客户端