分布式文件系统

MFS分布式文件系统

南楼画角 提交于 2019-12-26 15:43:04
一、MFS 简介: MooseFS是一个具有容错性的网络分布式文件系统。它把数据分散存放在多个物理服务器上,而呈现给用户的则是一个统一的资源。 (1)优势: 1、高可靠(数据的多个拷贝被存储在不同的计算机上); 2、通过附加新的计算机或者硬盘可以实现容量的动态扩展; 3、删除的文件可以根据一个可配置的时间周期进行保留(一个文件系统级别的回收站); 4、不受访问和写入影响的文件连贯快照。 (2)体系结构: 1、管理服务器(master server): 一台管理整个文件系统的独立主机,存储着每个文件的元数据(文件的大小、属性、位置信息,包括所有非常规文件的所有信息,例如目录、套接字、管道以及设备文件) 2、数据服务器群(chunk servers): 任意数目的商用服务器,用来存储文件数据并在彼此之间同步(如果某个文件有超过一个备份的话) 3、元数据备份服务器(metalogger server): 任意数量的服务器,用来存储元数据变化日志并周期性下载主要元数据文件,以便用于管理服务器意外停止时好接替其位置。 4、访问mfs的客户端: 任意数量的主机,可以通过mfsmount进程与管理服务器(接收和更改元数据)和数据服务器(改变实际文件数据)进行交流。 搭建MFS分布式文件系统 修改服务器主机名 [root@localhost ~]# hostnamectl set-hostname

GFS分布式文件系统集群(理论篇)

ぃ、小莉子 提交于 2019-12-26 01:01:35
GlusterFS概述 GlusterFS简介 开源的分布式文件系统 由存储服务器,客户端以及NFS/Samba存储网关组成 无元数据服务器 GlusterFS的特点 扩展性和高性能 高可用性 全局统一的命名空间 弹性卷管理 基于标准协议 GlusterFS术语 Brick : 存储节点 Volume : 卷 FUSE : 内核模块,用户端的交互模块 VFS : 虚拟端口 Glusterd : 服务 模块化堆栈架构 模块化、堆栈式的架构 通过对模块的组合,实现负责的功能 GlusterFS工作模式 GlusterFS工作流程 Application:客户端或应用程序通过GlusterFSync的挂载点访问数据 VFS:linux系统内核通过VFS API收到请求并处理 FUSE : VFS 将数据递交给FUSE内核文件系统,fuse文件系统则是将数据通过/dev/fuse设备文件递交给了GlusterFS client端 GlusterFS Client ; 通过网络将数据传递至远端的GlusterFS Server,并且写入到服务器存储设备上 弹性HASH算法 通过HASH算法得到一个32位的整数 划分为N个连续的子空间,每个空间对应一个Brick 弹性HASH算法的优点 保证数据平均分布在每一个Brink中 解决了对元数据服务器的依懒,进而解决了单点故障以及访问瓶颈

MFS分布式文件系统实战(一)——基础

China☆狼群 提交于 2019-12-25 14:07:13
一、MFS分布式文件系统简述 官方网站 1、MFS是什么? MooseFS是一个 具备容错性的分布式网络文件系统 ,它将数据分别存放在多个物理服务器(单独磁盘或分区)上,确保一份数据有多个备份副本。对于访问用户(客户端)来说,整个分布式网络文件系统集群看起来就像一个资源。 分布式文件系统的好处:集中访问、简化操作、数据容灾、提高文件的存取性能 。 特征: mfs是一个分层的目录树结构 存储支持POSIX标准的文件属性(权限,最后访问和修改时间) 支持特殊的文件,如:块设备,字符设备,管道和套接字,链接文件(符号链接和硬链接) 支持基于IP地址和密码的方式访问文件系统 2、MFS的特性 高可靠性 :每份数据可以设置多个副本,并可以存储在不同的主机上 高可扩展性 :可轻松的通过增加主机磁盘容量或增加主机数量来动态扩展整个文件系统的存储量 高可容错性 :删除的文件可以根据一个可配置的时间周期进行保留(一个文件系统级别的回收站) 高数据一致性 :即便文件被写入/访问时,我们依然可以完成对文件的一致性快照 3、MFS相关原理 分布式原理 分布式文件系统就是把一些分散在多台计算机上的共享文件夹,集合到一个共享文件夹内,用户要访问这些文件夹的时候,只要打开一个文件夹,就可以的看到所有链接到此文件夹内的共享文件夹。 MFS原理 MFS是一个具有容错性的网络分布式文件系统

GlusterFS分布式文件系统概述

≯℡__Kan透↙ 提交于 2019-12-24 18:26:39
博文目录 一、GlusterFS概述 1、GlusterFS的特点 2、GlusterFS术语 3、模块化堆栈式架构 二、GlusterFS的工作原理 1、GlusterFS的工作流程 2、弹性HASH算法 三、GlusterFS的卷类型 1、分布式卷 2、条带卷 3、复制卷 4、分布式条带卷 5、分布式复制卷 一、GlusterFS概述 GlusterFS是一个开源的分布式文件系统,同时也是Scale-Out存储解决方案Gluster的核心,在存储数据方面有强大的横向扩展能力,通过扩展不同的节点可以支持PB级别的存储容量。GlusterFS借助TCP/IP或InfiniBand RDMA网络将分散的存储资源汇聚在一起,同一提供存储服务,并使用单一全局命令空间来管理数据。GlusterFS基于可堆叠的用户空间以及无元的设计,可为各种不同的数据负载提供优异的性能。 GlusterFS主要由存储服务器、客户端及NFS/Samba存储网关(可选,根据需要选择使用)组成。GlusterFS架构中最大的设计特点就是没有元数据服务器组件,这有助于提升整个系统的性能、可靠性和稳定性。传统的分布式文件系统大多通过元服务器来存储元数据,元数据包含存储节点上的目录信息、目录结构等,这样的设计在浏览目录时效率非常高,但是也存在一些缺陷,如单点故障,一旦元数据服务器出现故障,即使节点具备再高的冗余性

MFS分布式文件系统

旧巷老猫 提交于 2019-12-23 14:45:21
MFS分布式文件系统 mfs工作原理 分布式原理 分布式文件系统就是把一些分散在多台计算机上的共享文件夹,集合到一个共享文件夹内,用户要访问这些文件夹的时候,只要打开一个文件夹,就可以的看到所有链接到此文件夹内的共享文件夹。 MFS原理 MFS是一个具有容错性的网络分布式文件系统,它把数据分散存放在多个物理服务器上,而呈现给用户的则是一个统一的资源。 MFS的组成 元数据服务器(Master):在整个体系中负责管理文件系统,维护元数据,目前不支持高可用。 元数据日志服务器(MetaLogger):备份Master服务器的变化日志文件,当master服务器损坏,可以从日志服务器中取得文件恢复。 数据存储服务器(Chunk Server):真正存储数据的服务器,服务器越多,容量就越大,可靠性越高,性能越好。 客户端(Client): 可以像挂载NFS一样 挂载MFS文件系统 MFS读数据的处理过程 - 客户端向元数据服务器发出读请求 - 元数据服务器把所需数据存放的位置(Chunk Server的IP地址和Chunk编号)告知客户端 - 客户端向已知的Chunk Server请求发送数据 - Chunk Server向客户端发送数据 写入的过程 - 客户端向元数据服务器发送写入请求 - 元数据服务器与Chunk Server进行交互,但元数据服务器只在某些服务器创建新的分块Chunks

FasterDFS分布式文件系统(实例!!!)

柔情痞子 提交于 2019-12-23 14:09:56
FasterDFS概述 ​ FastDFS是一个开源的轻量级分布式文件系统,它对文件进行管理,功能包括:文件存储、文件同步、文件访问(文件上传、文件下载)等,解决了大容量存储和负载均衡的问题。特别适合以文件为载体的在线服务,如相册网站、视频网站等等。 ​ FastDFS为互联网量身定制,充分考虑了冗余备份、负载均衡、线性扩容等机制,并注重高可用、高性能等指标,使用FastDFS很容易搭建一套高性能的文件服务器集群提供文件上传、下载等服务。 ​ FastDFS服务端有两个角色:跟踪器(tracker)和存储节点(storage)。跟踪器主要做调度工作,在访问上起负载均衡的作用。 ​ 跟踪器和存储节点都可以由一台或多台服务器构成。跟踪器和存储节点中的服务器均可以随时增加或下线而不会影响线上服务。其中跟踪器中的所有服务器都是对等的,可以根据服务器的压力情况随时增加或减少。在卷中增加服务器时,同步已有的文件由系统自动完成,同步完成后,系统自动将新增服务器切换到线上提供服务。 实验环境 服务器角色 IP地址 tracker 192.168.45.135 storage+nginx 192.168.45.132 第一步:安装libfastcommon服务(所有节点均进行安装) 1.安装基础环境包 yum -y install libevent libevent-devel perl make

GFS分布式文件系统集群(理论)

放肆的年华 提交于 2019-12-23 02:14:37
GlusterFS概述 1、GlusterFS简介 (1)开源的分布式文件系统 (2)由存储服务器、客户端以及NFS/Samba存储网关组成 (3)无元数据服务器(数据传输组件RDMA) (4)GlusterFS特点:扩展性、高性能、高可用性 (5)全局统一命名空间 (6)弹性卷 管理---->云的特性:水平(实例数)、垂直(硬件性能),包括ECS(虚拟)、OSS和RDS(裸金属) (7)基于标准协议 2、GlusterFS术语 (1)Brick(节点) (2)Volume(卷) (3)FUSE(用户端交互模块) (4)VFS(虚拟化文件系统) (5)Glusterd(服务) 3、模块化堆栈式架构 (1)模块化、堆栈式的架构 (2)通过对模块的组合,实现复杂的功能 GlusterFS工作原理 1、GlusterFS工作流程 2、弹性HASH算法 (1)通过HASH算法得到一个32位的整数 (2)划分为N个连续的子空间,每个空间对应一个Brick (3)弹性HASH算法的优点: ☀保证数据平均分布在每一个Brick中 ☀解决了对元数据服务器的依赖,进而解决了单点故障以及访问瓶颈 GlusterFS的卷类型 1、分布式卷 ●没有对文件进行分块处理 ●通过扩展文件属性保存HASH值 ●支持的底层文件系统有ext3、ext4、 ZFS、 XFS等 (1)分布式卷具有如下特点:

GFS分布式文件系统集群——实验

限于喜欢 提交于 2019-12-19 09:09:09
GFS分布式文件系统集群项目 群集环境 卷类型 卷名称 卷类型 空间大小 Brick dis-volume 分布式卷 40G node1(/b1)、node2(/b1) stripe-volume 条带卷 40G node1(/c1)、node2(/c1) rep-volume 复制卷 20G node3(/b1)、node4(/b1) dis-stripe 分布式条带卷 40G node1(/d1)、node2(/d1)、node3(/d1)、node4(/d1) dis-rep 分布式复制卷 20G node1(/e1)、node2(/e1)、node3(/e1)、node4(/e1) 实验准备 1、为四台服务器服务器每台添加4个磁盘 2、修改服务器的名称 分别修改为node1、node2、node3、node4 [ root @localhost ~ ] #hostnamectl set-hostname node1 [ root @localhost ~ ] # su 3、将四台服务器上的磁盘格式化,并挂载 在这里我们使用脚本执行挂载 #进入opt目录 [ root @node1 ~ ] # cd /opt #磁盘格式化、挂载脚本 [ root @node1 opt ] # vim a.sh #! /bin/bash echo "the disks exist list:"

GFS分布式文件系统集群——理论

一个人想着一个人 提交于 2019-12-19 08:53:13
GFS分布式文件系统集群 GlusterFS概述 GlusterFS简介 开源的分布式文件系统 由存储服务器,客户端以及NFS/Samba存储网关组成 无元数据服务器 RDMA:负责数据传输 GlusterFS的特点 扩展性和高性能 高可用性 全局统一的命名空间 弹性卷管理 基于标准协议 GlusterFS术语 Brick : 存储节点 Volume : 卷 FUSE : 内核模块,用户端的交互模块 VFS : 虚拟端口 Glusterd : 服务 模块化堆栈架构 模块化、堆栈式的架构 通过对模块的组合,实现负责的功能 GlusterFS工作模式 Application:客户端或应用程序通过GlusterFSync的挂载点访问数据 VFS:linux系统内核通过VFS API收到请求并处理 FUSE : VFS 将数据递交给FUSE内核文件系统,fuse 文件系统则是将数据通过/dev/fuse设备文件递交给了GlusterFS client端 GlusterFS Client ; 通过网络将数据传递至远端的GlusterFS Server,并且写入到服务器存储设备上 GlusterFS工作原理 GlusterFS工作流程 弹性HASH算法 通过HASH算法得到一个32位的整数 划分为N个连续的子空间,每个空间对应一个Brick 弹性HASH算法的优点

HDFS伪分布式环境搭建

前提是你 提交于 2019-12-19 00:05:17
HDFS概述及设计目标 什么是HDFS: 是Hadoop实现的一个分布式文件系统(Hadoop Distributed File System),简称HDFS 源自于Google的GFS论文 论文发表于2003年,HDFS是GFS的克隆版 HDFS的设计目标: 非常巨大的分布式文件系统 运行在普通廉价的硬件上 易扩展、为用户×××能不错的文件存储服务,也就是容错性 HDFS官方文档地址如下: https://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-hdfs/HdfsDesign.html HDFS架构 HDFS是主/从式的架构。一个HDFS集群会有一个NameNode(简称NN),也就是命名节点,该节点作为主服务器存在(master server)。NameNode用于管理文件系统的命名空间以及调节客户访问文件。此外,还会有多个DataNode(简称DN),也就是数据节点,数据节点作为从节点存在(slave server)。通常每一个集群中的DataNode,都会被NameNode所管理,DataNode用于存储数据。 HDFS公开了文件系统名称空间,允许用户将数据存储在文件中,就好比我们平时使用操作系统中的文件系统一样,用户无需关心底层是如何存储数据的。而在底层,一个文件会被分成一个或多个数据块