核心管理概念
以下核心概念是 MinIO 部署管理的基础,包括但不限于对象保留、加密和访问管理。
什么是对象存储?
一个对象是二进制数据,有时称为二进制大对象 (BLOB)。Blob 可以是图像、音频文件、电子表格,甚至二进制可执行代码。像 MinIO 这样的对象存储平台提供用于存储、检索和搜索 blob 的专用工具和功能。
MinIO 对象存储使用存储桶来组织对象。存储桶类似于文件系统中的文件夹或目录,每个存储桶可以容纳任意数量的对象。MinIO 存储桶提供与 AWS S3 存储桶相同的功能。
例如,考虑一个托管网络博客的应用程序。该应用程序需要存储各种 blob,包括丰富的多媒体内容,如视频和图像。
MinIO 通过前缀
功能支持多级嵌套目录,以支持即使是最动态的对象存储工作负载。
MinIO 如何确定对对象的访问权限?
MinIO 要求客户端对每个新操作执行身份验证和授权。身份和访问管理 (IAM)因此是 MinIO 配置的关键组成部分。
身份验证验证连接客户端的身份。MinIO 要求客户端使用AWS 签名版本 4 协议进行身份验证,并支持已弃用的签名版本 2 协议。具体来说,客户端必须提供有效的访问密钥和密钥才能访问任何 S3 或 MinIO 管理 API,例如PUT
、GET
和DELETE
操作。
MinIO 随后会检查经过身份验证的用户或客户端是否具有授权来执行操作或使用部署中的资源。MinIO 使用基于策略的访问控制 (PBAC),其中每个策略描述一个或多个规则,这些规则概述了用户或用户组的权限。MinIO 在创建策略时支持特定于 S3 的操作和条件。
默认情况下,MinIO 会拒绝对用户分配或继承的策略中未明确引用的操作或资源的访问。
MinIO 提供了一个作为软件一部分的访问管理功能。或者,您可以配置 MinIO 以使用以下任一方法与多个外部 IAM 提供程序进行身份验证:Active Directory/LDAP 或OpenID/OIDC。
MinIO 如何保护数据?
MinIO 支持在驱动器上(静态加密)以及从一个位置到另一个位置传输过程中(传输中加密,或“飞行中”加密)对对象进行编码的方法。启用后,MinIO 会利用服务器端加密以加密状态写入对象。要检索和读取加密对象,用户必须拥有适当的访问权限,并提供对象的解密密钥。
MinIO 支持传输层安全性 (TLS) 1.2 和 1.3 版本对对象进行加密。TLS 取代了以前使用的安全套接字层 (SSL) 方法,该方法现已弃用。TLS 标准由互联网工程任务组 (IETF) 维护,提供了互联网通信用于支持加密、身份验证和数据完整性的标准。
对用户进行身份验证并验证对对象的访问的过程称为TLS 握手。身份验证后,TLS 会提供用于加密和解密从服务器到请求客户端的信息传输的密码。
MinIO 支持多种服务器端加密方法。
我可以在桶内以文件夹结构组织对象吗?
MinIO 使用每个对象的前缀方法模拟传统文件系统中的文件夹结构。前缀涉及在对象的名称前添加一个固定字符串。
使用前缀,您无需手动创建文件夹和子文件夹。相反,MinIO 会在对象的名称前缀中查找/
字符。每个/
表示一个新的文件夹或子文件夹。
MinIO 使用对象的名称和前缀自动生成一系列文件夹和子文件夹来存储对象。当您在多个对象上使用相同的字符串前缀时,MinIO 会将它们识别为相似或分组的对象。
例如,名为/articles/john.doe/2022-01-02-MinIO-Object-Storage.md
的对象最终会位于名为john.doe
的文件夹中,位于articles
桶中。
MinIO 对象存储可能类似于以下结构,其中包含三个桶。MinIO 根据这些对象的的前缀自动在articles
桶中生成两个文件夹。
/ #root
/images/
2022-01-02-MinIO-Diagram.png
2022-01-03-MinIO-Advanced-Deployment.png
MinIO-Logo.png
/videos/
2022-01-04-MinIO-Interview.mp4
/articles/
/john.doe/
2022-01-02-MinIO-Object-Storage.md
2022-01-02-MinIO-Object-Storage-comments.json
/jane.doe/
2022-01-03-MinIO-Advanced-Deployment.png
2022-01-02-MinIO-Advanced-Deployment-comments.json
2022-01-04-MinIO-Interview.md
MinIO 本身不限制任何特定前缀可以包含的对象数量。但是,硬件和网络条件可能会对大型前缀的性能产生影响。
使用适度或以预算为中心的硬件的部署应将其工作负载架构设计为以每个前缀 10,000 个对象作为基线。根据基准测试和对实际工作负载的监控,将此目标提高到硬件可以有效处理的程度。
使用高性能或企业级硬件的部署通常可以处理包含数百万个或更多对象的前缀。
MinIO SUBNET 企业帐户可以利用年度架构审查作为部署和维护策略的一部分,以确保 MinIO 相关项目的长期性能和成功。
有关限制前缀内容的好处的更深入讨论,请参阅有关优化 S3 性能的文章。
我如何备份和恢复 MinIO 上的对象?
MinIO 提供两种类型的复制,用于将对象、其版本及其元数据从一个位置复制到另一个位置。您可以在桶级别或站点级别配置复制。
桶级复制可以作为单向、主动-被动复制(例如用于归档目的)或作为双向、主动-主动复制来保持两个桶彼此同步。
站点级复制作为双向、主动-主动复制来保持多个数据位置(例如不同的地理数据中心)彼此同步。
除了复制之外,MinIO 还提供镜像服务。mc mirror
仅将实际对象复制到任何其他与 S3 兼容的数据存储,包括其他 MinIO 存储。但是,版本和元数据不会与mc mirror
命令一起备份。
对驱动器的独占访问
MinIO**需要**对用于对象存储的驱动器或卷进行独占访问。任何其他进程、软件、脚本或人员都不应直接对提供给 MinIO 的驱动器或卷或 MinIO 放置在其上的对象或文件执行任何操作。
除非 MinIO 工程师指示,否则请勿使用脚本或工具直接修改、删除或移动提供的驱动器上的任何数据分片、奇偶校验分片或元数据文件,包括从一个驱动器或节点移动到另一个驱动器或节点。此类操作很可能导致广泛的损坏和数据丢失,超出 MinIO 的修复能力。
MinIO 提供了哪些工具来根据速度和访问频率管理对象?
分层规则 允许频繁访问的对象存储在热存储或温存储上,这通常成本更高,但提供更好的性能。
访问频率较低的对象可以移动到冷存储。冷存储通常以较慢的性能换取更低的价格。
MinIO 如何防止意外覆盖或删除对象?
锁定
锁定(一种一次写入多次读取 (WORM) 机制)可防止删除或修改对象。锁定后,MinIO 会无限期保留对象,直到有人删除锁定或锁定过期。
MinIO 提供
版本控制
默认情况下,使用相同名称(包括前缀)写入的对象会覆盖同名的现有对象。MinIO 提供了一个配置选项,用于创建启用了版本控制的桶。版本控制 提供对唯一命名对象的各种迭代的访问,这些迭代会随着时间的推移而发生变化。启用后,MinIO 会将变异的对象写入与原始对象不同的版本,从而允许访问原始对象和更新的已更改对象。
MinIO 桶上的其他配置确定在桶中保留每个对象的旧版本的时长。