OpenStack的Swift组件详解_综合编程-免费资源网

来自：网络

时间：2021-04-27

阅读：

一：简介

背景

1.Swift 最初是由 Rackspace 公司开发的高可用分布式对象存储服务（Object Storage Service），并于 2010 年贡献给 OpenStack 开源社区作为其最初的核心子项目之一，为其 Nova 子项目提供虚机镜像存储服务。Swift 构筑在比较便宜的标准硬件存储基础设施之上，无需采用 RAID（磁盘冗余阵列），通过在软件层面引入一致性散列技术和数据冗余性，牺牲一定程度的数据一致性来达到高可用性和可伸缩性，支持多租户模式、容器和对象读写操作，适合解决互联网的应用场景下非结构化数据存储问题。

2. Swift 包括2个组成部分，一个是代理服务（proxy）,一个是存储服务（storage）。

代理服务是Swift内部存储的拓扑逻辑，即一个具体文件位于哪个存储节点的哪个区上。它同时是一个web服务器，通过http或https对外提供REST API服务。存储服务是负责文件存储的服务，由3个组件组成：account-server、container-server、object-server。其中object-server负责具体的文件存储，container-server包含到每个object的索引，account-server包含到每个container 的索引。

原理

1. 一致性散列（Consistent Hashing)：Swift 是基于一致性散列技术，通过计算可将对象均匀分布到虚拟空间的虚拟节点上，在增加或删除节点时可大大减少需移动的数据量；虚拟空间大小通常采用 2 的 n 次幂，便于进行高效的移位操作；然后通过独特的数据结构 Ring（环）再将虚拟节点映射到实际的物理存储设备上，完成寻址过程。

1. 平衡性：平衡性是指哈希的结果能够尽可能的分布到所有的缓冲中去，这样可以使得所有缓冲空间能够都得到利用。为了更好的满足平衡性，引入了虚拟节点概念，虚拟节点是实际节点在hash空间的复制品，一个实际节点对应若干个虚拟节点，这个对应的个数也称为复制个数，虚拟节点在hash空间以hash值排列。 2. 单调性：单调性是指如果已经有些内容通过Hash分派到相应的缓冲中，又有新的缓冲加入到系统中，哈希的结果应能够保证原有已分配的内容可以被映射到原有或者新的缓冲中区，而不会被映射到旧的或者其他缓冲区。 3. 分散性：在分布式环境中，客户端可能看不到所有的缓冲，而只能看到其中一部分。当终端希望通过哈希过程将内容映射到缓冲上时，由于不同的客户端所看到的缓冲范围可能不同，从而导致得到的Hash结果不一致，导致结果相同的内容被映射到不用的缓冲区中。这种情况应该被避免，因为这将会导致相同的内容将会被映射到不同缓冲区中，降低了系统的存储效率。 4. 负载：负载时对分散性要求的另一个维度。既然相同的内容可能被映射到不同的缓冲中去，那么对于同一个缓冲而言，就有可能被不同的用户映射不同的内容。与分散性一样，这种情况应该被避免。 5. 如图所示，以逆时针方向递增的散列空间有 4 个字节长共 32 位，整数范围是[0~232-1]；将散列结果右移 m 位，可产生 232-m个虚拟节点，例如 m=29 时可产生 8 个虚拟节点。在实际部署的时候需要经过仔细计算得到合适的虚拟节点数，以达到存储空间和工作负载之间的平衡。

2. 数据一致性模型（Consistency Model）

按照 Eric Brewer 的 CAP（Consistency，Availability，Partition Tolerance）理论，无法同时满足 3 个方面，Swift 放弃严格一致性（满足 ACID 事务级别），而采用最终一致性模型（Eventual Consistency），来达到高可用性和无限水平扩展能力。为了实现这一目标，Swift 采用 Quorum 仲裁协议(Quorum 有法定投票人数的含义)：

定义：N：数据的副本总数；W：写操作被确认接受的副本数量；R：读操作的副本数量强一致性：R+W>N，以保证对副本的读写操作会产生交集，从而保证可以读取到最新版本；如果 W=N，R=1，则需要全部更新，适合大量读少量写操作场景下的强一致性；如果 R=N，W=1，则只更新一个副本，通过读取全部副本来得到最新版本，适合大量写少量读场景下的强一致性。弱一致性：R+W<=N，如果读写操作的副本集合不产生交集，就可能会读到脏数据；适合对一致性要求比较低的场景。

Swift 针对的是读写都比较频繁的场景，所以采用了比较折中的策略，即写操作需要满足至少一半以上成功 W >N/2，再保证读操作与写操作的副本集合至少产生一个交集，即 R+W>N。Swift 默认配置是 N=3，W=2>N/2，R=1 或 2，即每个对象会存在 3 个副本，这些副本会尽量被存储在不同区域的节点上；W=2 表示至少需要更新 2 个副本才算写成功；当 R=1 时意味着某一个读操作成功便立刻返回，此种情况下可能会读取到旧版本（弱一致性模型）；当 R=2 时，需要通过在读操作请求头中增加 x-newest=true 参数来同时读取 2 个副本的元数据信息，然后比较时间戳来确定哪个是最新版本（强一致性模型）；如果数据出现了不一致，后台服务进程会在一定时间窗口内通过检测和复制协议来完成数据同步，从而保证达到最终一致性。如图 2 所示：

3. 环的数据结构

环是为了将虚拟节点（分区）映射到一组物理存储设备上，并提供一定的冗余度而设计的，其数据结构由以下信息组成：

存储设备列表、设备信息包括唯一标识号（id）、区域号（zone）、权重（weight）、IP 地址（ip）、端口（port）、设备名称（device）、元数据（meta）。分区到设备映射关系（replica2part2dev_id 数组)。计算分区号的位移(part_shift 整数)。

使用对象的层次结构 account/container/object 作为键，使用 MD5 散列算法得到一个散列值，对该散列值的前 4 个字节进行右移操作得到分区索引号，移动位数由上面的 part_shift 设置指定；按照分区索引号在分区到设备映射表（replica2part2dev_id）里查找该对象所在分区的对应的所有设备编号，这些设备会被尽量选择部署在不同区域（Zone）内，区域只是个抽象概念，它可以是某台机器，某个机架，甚至某个建筑内的机群，以提供最高级别的冗余性，建议至少部署 5 个区域；权重参数是个相对值，可以来根据磁盘的大小来调节，权重越大表示可分配的空间越多，可部署更多的分区。

4. 数据模型

Swift 采用层次数据模型，共设三层逻辑结构：Account/Container/Object（即账户/容器/对象)，每层节点数均没有限制，可以任意扩展。

账户和个人账户不是一个概念，可理解为租户，用来做顶层的隔离机制，可以被多个个人账户所共同使用；

容器代表封装一组对象，类似文件夹或目录；叶子节点代表对象，由元数据和内容两部分组成，如图所示：

特性

1.大量对象的存储（Storageoflargenumberofobjects）。

2. 大对象的存储（Storageoflargesizedobjects）。

3. 数据冗余（DataRedundancy）。

4. 档案能力——存储大数据集（Archivalcapabilities-Workwithlargedatasets）。

5. 虚拟机和云应用的数据容器（Datacontainerforvirtualmachinesandcloudapps）。

6. 流媒体的能力（MediaStreamingcapabilities）。

7. 对象存储安全（Securestorageofobjects）。

8. 备份和档案（Backupandarchival）。

9. 极高的扩展性（Extremescalability）

二：架构

核心架构

组件详解

1. 代理服务（Proxy Server）：对外提供对象服务 API，会根据环的信息来查找服务地址并转发用户请求至相应的账户、容器或者对象服务；由于采用无状态的 REST 请求协议，可以进行横向扩展来均衡负载。

2. 认证服务（Authentication Server）：验证访问用户的身份信息，并获得一个对象访问令牌（Token），在一定的时间内会一直有效；验证访问令牌的有效性并缓存下来直至过期时间。

3. 缓存服务（Cache Server）：缓存的内容包括对象服务令牌，账户和容器的存在信息，但不会缓存对象本身的数据；缓存服务可采用 Memcached 集群，Swift 会使用一致性散列算法来分配缓存地址。

4. 账户服务（Account Server）：提供账户元数据和统计信息，并维护所含容器列表的服务，每个账户的信息被存储在一个 SQLite数据库中。

5. 容器服务（Container Server）：提供容器元数据和统计信息，并维护所含对象列表的服务，每个容器的信息也存储在一个 SQLite 数据库中。

6. 对象服务（Object Server）：提供对象元数据和内容服务，每个对象的内容会以文件的形式存储在文件系统中，元数据会作为文件属性来存储，建议采用支持扩展属性的 XFS 文件系统。

7. 复制服务（Replicator）：会检测本地分区副本和远程副本是否一致，具体是通过对比散列文件和高级水印来完成，发现不一致时会采用推式（Push）更新远程副本，例如对象复制服务会使用远程文件拷贝工具 rsync 来同步；另外一个任务是确保被标记删除的对象从文件系统中移除。

8. 更新服务（Updater）：当对象由于高负载的原因而无法立即更新时，任务将会被序列化到在本地文件系统中进行排队，以便服务恢复后进行异步更新；例如成功创建对象后容器服务器没有及时更新对象列表，这个时候容器的更新操作就会进入排队中，更新服务会在系统恢复正常后扫描队列并进行相应的更新处理。

9. 审计服务（Auditor）：检查对象，容器和账户的完整性，如果发现比特级的错误，文件将被隔离，并复制其他的副本以覆盖本地损坏的副本；其他类型的错误会被记录到日志中。

10. 账户清理服务（Account Reaper）：移除被标记为删除的账户，删除其所包含的所有容器和对象。

Swift对CAP的支持程度

1. CAP概述：美国著名科学家，Berkerly大学Brewer教授提出的一个分布式系统不能同时满足一致性，可用性和分区容错性这三个需求，最多只能同时满足两个。重要属性：

一致性(Consistency)：任何一个读操作总是能读取到之前完成的写操作结果，也就是在分布式环境中，多点的数据是一致的。可用性(Availability)：每一个操作总是能够在确定的时间内返回，也就是系统随时都是可用的。分区可容忍性(ToleranceofnetworkPartition)：在出现网络分区（比如断网）的情况下，分离的系统也能正常运行。

2. Swift对CAP的支持

Consistency：Swift的一致性归为弱一致性模型。Swift 由 updater 保证最终一致性，auditor 保证存储对象的完整性。Swift 只能保证数据的最终一致性，即，如果upload(update也是一种upload)一个object,从其他客户端GET这个object，不一定是最新的。 Availability：基于python对hash的原生支持，swift中广泛使用了hash算法。比如均衡ring中partition的分布，objectupdate备份策略。sqlite控制account/container/object的相关信息，简化了维护成本。

三：常用操作

以上就是OpenStack的Swift组件详解的详细内容，更多关于OpenStack的Swift的资料请关注其它相关文章！

前言最近在学习 ES，所以需要在服务器上装一个单节点的 ES服务器环境：centos 7.9安装下载镜像目前最新版本是 8.12.2docker pull docker.elastic.co/elasticsearch/elasticsear

2024-03-15 20:55:15

MD5算法起源：MD5（Message Digest Algorithm 5）算法是由MIT的计算机科学家Ronald Rivest于1991年设计的一种消息摘要算法。MD5算法最初被用于提供数据完整性和一致性的验证，后来

2024-03-15 20:51:05

1、概述Node Feature Discovery（NFD）是由Intel创建的项目，能够帮助Kubernetes集群更智能地管理节点资源。它通过检测每个节点的特性能力（例如CPU型号、GPU型号、内存大小等）并将

2024-03-15 00:56:29

有网友问WPF中一些文字模糊是什么问题。之前我也没有认真思考过这个问题，只是大概知道和WPF的像素对齐（pixel snapping）、抗锯齿（anti-aliasing）有关，通过设置附加属性TextOptions

2024-03-13 00:01:53

0. 前言在 Kubernetes 架构中，controller manager 是一个永不休止的控制回路组件，其负责控制集群资源的状态。通过监控 kube-apiserver 的资源状态，比较当前资源状态和期望状态

2024-03-11 18:41:24

二者都是Lua中内置的迭代器，可以对数组或table进行遍历。在正常的数组或table的遍历中，二者没有区别。tableNormal={"this","is","a","array"}--使用 pairs 遍历for key,val i

2024-03-08 22:34:40

Lua调试的时候会用到debug.getinfo()函数，what的值文档给了解释： "Lua" : Lua function "C" : C function "main" : main part of a chunk (通过load函数等执行的语句）关于name

2024-02-28 16:24:33

1 前言 Filament 是一个实时物理渲染引擎，用于 Android、iOS、Linux、macOS、Windows 和 WebGL 平台。该引擎旨在提供高效、实时的图形渲染，并被设计为在 Android 平台上尽

2024-02-26 22:59:17

RAG 评测数据集建设尚处于初期阶段，缺乏针对特定领域和场景的专业数据集。市面上常见的 MS-Marco 和 BEIR 数据集覆盖范围有限，且在实际使用场景中效果可能与评测表现不符。目

2024-02-26 22:12:53

一.整体思路　　我们在用纹理增加细节那篇文章中提到过，要将图片渲染在屏幕上，首先要拿到图片的像素数组数据，然后将像素数组数据通过纹理单元传递到片段着色器中，最后通过纹理

2024-02-26 22:10:59

问题描述：通过DocumentFormat.OpenXml解析PPTX文件时遇到异常：“\b”(十六进制值 0x08)是无效的字符,查看文件发现存在乱码，乱码的十六进制值刚好时异常中提到的0x08

2024-01-31 21:50:28

curl_formadd 是用于在 libcurl 中添加表单数据的函数之一。它被用于 POST 请求中，将表单字段和值添加到请求体中。以下是 curl_formadd 函数的基本语法： CURLFORMcode curl_f

2024-01-24 19:42:23

什么是Json Schema ？Json schema是一种声明式语言，它可以用来标识Json的结构，数据类型和数据的具体限制，它提供了描述期望Json结构的标准化方法。
利用Json Schema, 你可以定义J

2024-01-24 19:41:48

前言本文试图搞清楚cache几个操作：clean、invalidate与flush的含义。由于只用过ARM和RISC-V，所以是从ARM和RISC-V的角度来说明。cache linecache line是cache的基本访问单元。

2024-01-24 19:39:40

什么是 Flutter Flutter 是由 Google 开发的开源框架 Flutter 用于构建跨平台的移动应用程序 Flutter 它允许开发者使用同一套代码来同时为 IOS 和 Android 平台开发应用程

2024-01-24 19:38:30

目录简介发展历史应用场景 Jenkins 安装部署先决条件硬件要求软件包下载 war 包部署 linux 系统部署 mac 系统部署 windows 系统部署安装后基本配置

2024-01-24 19:35:24

哈喽大家好，我是咸鱼今天分享一篇文章，是关于 TCP 拥塞控制对数据延迟产生的影响的。作者在服务延迟变高之后进行抓包分析，结果发现时间花在了 TCP 本身的机制上面：客户端并不是

2024-01-24 19:35:01

SetFitABSA 是一种可以有效从文本中检测方面级情感的技术。方面级情感分析 (Aspect-Based Sentiment Analysis，ABSA) 是一种检测文本中特定方面的情感的任务。例如，在“

2024-01-24 19:34:23

前言有时出现的线上bug在测试环境死活都不能复现，靠review代码猜测bug出现的原因，然后盲改代码直接在线上测试明显不靠谱。这时我们就需要在生产环境中debug代码，快速找到bug的

2024-01-24 19:33:00

目录map方法的使用and_then方法的使用rust基础学习历程先提一个建议如果是通过rust官网入门的话，个人感觉《通过例子学 Rust》会比《Rust 程序设计语言》更好一些。我这里的

2023-09-08 12:02:11

目录1、ChatGPT介绍2、体验ChatGPT1、ChatGPT介绍ChatGPT: Optimizing Language Models for Dialogue，即优化对话的语言模型，它以对话的方式进行交互。对话形式使ChatGPT能够

2023-06-25 22:12:43

目录前言问题分析问题复现问题原因问题解决ChatGPT 分析ChatGPT 分析代码ChatGPT 实现功能总结附录：ChatGPT 写代码测试问1问2问3本文 Github.com/niumoo/JavaNotes 和未读

2023-06-25 22:12:13

目录报错信息描述第一种：看一下这里是否有中文目录，有的话有可能会报错。第二种、管理员身份运行vscode第三种： node-sass版本问题解决版本问题方案：总结报错信息描述当我们在vs

2023-06-25 22:11:58

目录1.生成编码框架2.研究和比较3.理解代码4.向代码添加注释5.使用某种样式重写代码ChatGPT 的出现，彻底改变了开发代码的方式。但是目前为止，大多数软件开发人员和数据专业人

2023-06-25 22:11:37

ChatGPT（全名：Chat Generative Pre-trained Transformer），美国OpenAI 研发的聊天机器人程序，于2022年11月30日发布。ChatGPT是人工智能技术驱动的自然语言处理工具，它能够通过

2023-06-25 22:09:52

目录Chatgpt Access denied Error code 1020如何解决？一、问题原因二、解决方案方案1 清理cookie方案2 换VPN方案3 重置DNS最后，我们又可以愉快的和chatGPT玩耍了！！！最

2023-06-25 22:09:28

目录一、简介二、安装教程三、使用教程一、简介DBeaver是一个通用的数据库管理工具和 SQL 客户端，支持 MySQL, PostgreSQL, Oracle,DB2, MSSQL, Sybase, Mimer, HSQLDB, Derb

2023-06-14 22:43:34

目录安装 timeshif备份设置选择快照类型选择储存位置设置计划备份系统恢复可视化恢复(可进入系统)命令行恢复(系统崩溃,可进入命令行)ArchLinux Live CD恢复(无法进入系统)

2023-05-29 21:57:40

由于Maui Blazor中界面是由WebView渲染，所以再使用Android的摄像头时无法去获取，因为原生的摄像头需要绑定界面组件
所以我找到了其他的实现方式，通过WebView使用js调用设备摄

2023-05-29 21:57:18

目录1 plot 函数语法2 示例2.1 plot(X,Y) | plot(X1,Y1,X2,Y2)2.2 plot(X,Y.Linespec) | plot(X1,Y1,Linespec1,X2,Y2,Linespec2)2.3 plot(X) | plot(X, Linespec)2.4 plot(

2023-05-29 21:57:09

2020-09-27

2018-09-21

2018-09-02

2021-03-15

2022-12-16

2019-08-24

2021-03-10

2020-09-16

2019-07-29

2018-09-02

OpenStack的Swift组件详解

一：简介

背景

原理

特性

二：架构

核心架构

组件详解

Swift对CAP的支持程度

三：常用操作

热点内容

免费资源网

在线工具

扫一扫随时看

本站下载频道