文档

存储桶复制

MinIO 支持在源存储桶和目标存储桶之间进行对象服务器端和客户端复制。

服务器端存储桶复制

配置每个存储桶规则,以便在 MinIO 部署之间自动同步对象。配置存储桶复制规则的部署充当“源”,而配置的远程部署充当“目标”。MinIO 将规则应用于对象写入操作(例如 PUT)的一部分,并自动同步新对象以及对象变异,例如新对象版本或对象元数据的更改。

MinIO 服务器端存储桶复制仅支持远程复制目标上的相同版本的 MinIO 集群。

客户端存储桶复制

使用命令进程在同一个 S3 兼容集群内的存储桶之间在两个独立的 S3 兼容集群之间同步对象。使用 mc mirror 进行的客户端复制支持 MinIO 到 S3 和类似的复制配置。

存储桶与站点复制

存储桶复制不同于并且与 站点复制 相互排斥。

  • 存储桶复制在存储桶级别同步数据,例如存储桶前缀路径和对象。

    您可以随时配置存储桶复制,并且远程 MinIO 部署可能在复制目标存储桶上拥有预先存在的数据。

  • 站点复制将存储桶复制扩展到包括 IAM、安全令牌、访问密钥和存储桶级配置。

    站点复制通常在最初部署 MinIO 对等站点时进行配置。在初始配置时,只有一个站点可以拥有任何存储桶或对象。

服务器端存储桶复制

MinIO 服务器端存储桶复制是一种自动的存储桶级配置,它在源存储桶和目标存储桶之间同步对象。MinIO 服务器端复制需要源存储桶和目标存储桶是两个独立的 MinIO 集群,运行相同的 MinIO 服务器版本。

对于对存储桶的每次写入操作,MinIO 会检查为该存储桶配置的所有复制规则,并应用具有最高配置优先级的匹配规则。MinIO 会同步新对象以及对象变异,例如新对象版本或对象元数据的更改。这包括元数据操作,例如启用或修改对象锁定或保留设置。

MinIO 服务器端存储桶复制在功能上类似于 Amazon S3 复制,同时添加以下 MinIO 独有的功能

  • 源存储桶和目标存储桶名称可以匹配,支持站点到站点的用例,例如 Splunk 或 Veeam BC/DR。

  • 比 S3 存储桶复制配置更简单的实现,无需配置 AccessControlTranslation、指标和 SourceSelectionCriteria 等设置。

  • 源存储桶和目标存储桶之间的对象主动-主动(双向)复制。

  • 在三个或更多 MinIO 部署之间进行多站点复制

重新同步(灾难恢复)

重新同步主要支持在使用副本配置中的健康部署后恢复 MinIO 部署中的部分或全部数据丢失。 使用 mc replicate resync 命令完全重新同步远程目标 (mc admin bucket remote),使用指定的源存储桶。

重新同步过程会检查源存储桶中的所有对象,以对比包含 现有对象复制 的所有配置的复制规则。 对于每个与规则匹配的对象,重新同步过程会将对象放入复制 队列 中,无论对象的当前 复制状态 如何。

MinIO 会跳过同步那些其远程副本与源副本完全匹配的对象,包括对象元数据。 否则,MinIO 不会优先考虑或修改队列,以考虑目标的现有内容。

mc replicate resync 在存储桶级别上运行,不支持 前缀级别的粒度。 在大型存储桶上启动重新同步可能会导致复制相关的负载和流量显着增加。 请谨慎使用此命令,并在必要时使用。

对于配置了 对象转换 (分层) 的存储桶,复制重新同步会将对象恢复到非转换状态,且没有任何相关的转换元数据。 因此,以前迁移到远程存储的任何数据都将永久断开与远程 MinIO 部署的连接。 对于在远程配置中指定显式人可读前缀的分层配置,您可以安全地清除该前缀中的已迁移数据,以避免与“丢失”数据相关的成本。

删除操作的复制

MinIO 支持复制 删除 操作,其中 MinIO 会同步删除特定对象版本以及新的 删除标记。 删除操作复制使用与所有其他复制操作相同的 复制过程

MinIO 需要显式启用版本化删除和删除标记复制。 使用 mc replicate add --replicate 字段分别指定 deletedelete-marker 以启用版本化删除和删除标记复制。 要启用两者,请使用逗号分隔符 delete,delete-marker 指定两个字符串。

对于删除标记复制,MinIO 在删除操作创建删除标记后开始复制过程。 MinIO 使用 X-Minio-Replication-DeleteMarker-Status 元数据字段跟踪删除标记复制状态。 在 主动-主动 复制配置中,如果两个集群同时为对象创建删除标记如果一个或两个集群在复制事件同步之前处于停机状态,则 MinIO 可能会生成重复的删除标记。

对于复制特定对象版本的删除,MinIO 将对象版本标记为 PENDING,直到复制完成。 一旦远程目标删除了该对象版本,MinIO 就会删除源上的对象。 虽然此过程确保了近乎同步的版本删除,但它可能会导致列出操作在初始删除操作后返回对象版本。 MinIO 使用 X-Minio-Replication-Delete-Status 跟踪删除版本复制状态。

MinIO 仅复制显式客户端驱动的删除操作。 MinIO 不会 复制从应用 生命周期管理过期规则 中删除的对象。 对于 主动-主动 配置,在所有复制存储桶上设置相同的过期规则,以确保一致地应用对象过期。

现有对象的复制

默认情况下,MinIO 会将源存储桶中的现有对象复制到配置的远程位置,类似于 AWS:在 S3 存储桶之间复制现有对象,而无需联系技术支持的额外开销。

MinIO 将所有满足复制规则的对象或对象前缀标记为有资格同步到远程集群和存储桶。 MinIO 仅排除那些没有版本 ID 的对象,例如在启用存储桶的版本化之前写入的对象。

您可以在配置或修改存储桶复制规则时禁用现有对象复制。 您必须在创建或修改期间指定所有所需的复制功能

禁用现有对象复制不会删除已经复制到远程存储桶的任何对象。

同步与异步复制

MinIO 支持为给定的远程目标指定异步(默认)或同步复制。

使用异步复制,MinIO 会在将对象放入 复制队列 之前完成原始的 PUT 操作。 因此,原始客户端可能会在对象复制之前看到成功的 PUT 操作。 虽然这可能会导致远程位置的对象陈旧或丢失,但它可以减轻由于复制负载导致写入操作缓慢的风险。

使用同步复制,MinIO 会尝试在完成原始 PUT 操作之前复制对象。 无论复制尝试是否成功,MinIO 都将返回成功的 PUT 操作。 这可以降低写入操作缓慢的风险,但可能会导致远程位置的对象陈旧或丢失。

在使用 mc admin bucket remote add 命令配置远程目标时,您必须使用 add 标志显式启用同步复制。

复制内部机制

本节介绍内部复制行为,对于使用或实施复制并不重要。 此文档仅出于学习和教育目的提供。

复制过程

MinIO 使用一个复制队列系统,多个并发复制工作器在该队列上运行。MinIO 持续工作,从队列中复制和删除对象,同时扫描以查找要添加到队列中的新未复制对象。

更改版本 RELEASE.2022-07-18T17-49-40Z: MinIO 将失败的复制操作排队,并最多重试这些操作三次 (3) 次。

MinIO 将三次尝试后仍未成功复制的复制操作出队。扫描程序稍后可以获取这些受影响的对象并将它们重新排队以进行复制。

更改版本 RELEASE.2022-08-11T04-37-28Z: 执行列表或任何 GETHEAD API 方法时,失败或待处理的复制会自动重新排队。例如,使用 mc statmc catmc ls 在远程位置重新上线后会重新排队复制。

MinIO 根据对象的复制状态设置 X-Amz-Replication-Status 元数据字段

复制状态

描述

PENDING

该对象尚未复制。如果对象满足存储桶上的一个配置的复制规则,MinIO 将应用此状态。MinIO 持续扫描 PENDING 对象,这些对象尚未在复制队列中,并在有可用空间时将它们添加到队列中。

对于多站点复制,对象将保持在 PENDING 状态,直到复制到该存储桶或存储桶前缀的所有配置的远程端。

COMPLETED

该对象已成功复制到远程集群。

FAILED

该对象无法复制到远程集群。

MinIO 持续扫描 FAILED 对象,这些对象尚未在复制队列中,并在有可用空间时将它们添加到队列中。

REPLICA

该对象本身是来自远程来源的副本。

复制过程通常具有以下流程之一

  • PENDING -> COMPLETED

  • PENDING -> FAILED -> COMPLETED