站点故障恢复
MinIO 可以使整个站点丢失,虽然很严重,但成为相对较小的事件。站点恢复取决于您用于站点的复制选项。
站点复制 |
从健康的对等方站点完全恢复 IAM 配置、存储桶配置和数据 |
存储桶复制 |
为复制配置的每个存储桶从健康的远程位置恢复对象和元数据 |
仅从健康的远程位置恢复对象,不进行版本控制 |
站点复制修复会自动将 IAM 设置、存储桶、存储桶配置和对象从现有站点添加到新站点,无需进一步操作。
如果其他健康站点上存在任何存储桶复制规则,则无法配置站点复制。存储桶复制与站点复制互斥。
如果您要从使用存储桶复制切换到使用站点复制,则必须首先从健康站点删除所有存储桶复制规则,然后再设置站点复制。
将不健康的对等方恢复到站点复制
重要
RELEASE.2023-01-02T09-40-09Z MinIO 服务器版本包含用于从包含三个或更多对等方站点的复制配置中删除已关闭站点的重要修复。
对于为站点复制配置的部署,计划 测试和升级 所有对等方站点到指定版本。如果发生站点故障,您可以将剩余的健康站点更新到指定版本并使用此过程。
站点复制 使两个或更多 MinIO 部署与 IAM 策略、存储桶、存储桶配置、对象和对象元数据保持同步。如果对等方站点发生故障,例如由于重大灾难或长时间断电,您可以使用剩余的健康站点来恢复 可复制数据.
以下过程可以恢复 站点复制 在站点丢失之前处于活动状态的情况下的数据。此过程假定一个或多个对等方站点的完全丢失,而不是由于延迟或瞬态部署停机导致的复制滞后或延迟。
使用
mc admin replicate rm命令和--force选项,从 MinIO 站点复制配置中删除失败的站点。以下命令强制从复制配置中删除不健康的对等方站点
mc admin replicate rm HEALTHY_PEER UNHEALTHY_PEER --force
将
HEALTHY_PEER替换为复制配置中任何健康对等方的 别名将
UNHEALTHY_PEER替换为不健康的对等方站点的别名
站点复制配置中所有健康的对等节点会自动更新以移除不健康的对等节点。您可以使用
mc admin replicate info命令来验证新的站点复制配置。按照 站点复制需求 部署一个新的 MinIO 站点。
除了规定的要求以外,不要上传任何数据或配置部署。
验证新的 MinIO 部署是否正常运行并与其他对等站点之间具有双向连接。
确保新站点的服务器版本与现有对等站点上的版本一致。
警告
mc admin replicate rm --force命令仅对站点复制配置中的在线或健康节点起作用。已移除的离线 MinIO 部署将保留其原始复制配置,因此如果部署恢复正常运行,它将继续对其配置的对等站点执行复制操作。如果您打算将硬件重新用于站点复制配置,则在重新初始化 MinIO 并将站点添加回复制配置之前,**必须**完全擦除部署的驱动器。
-
使用
mc admin replicate add命令更新包含新站点的复制配置。mc admin replicate add HEALTHY_PEER NEW_PEER
将
HEALTHY_PEER替换为复制配置中任何健康对等方的 别名将
NEW_PEER替换为新对等节点的别名。
站点复制配置中所有健康的对等节点会自动更新以包含新对等节点。您可以使用
mc admin replicate info命令来验证新的站点复制配置。 使用
mc admin replicate resync重新同步新对等节点。mc admin replicate resync start HEALTHY_PEER NEW_PEER
将
HEALTHY_PEER替换为复制配置中任何健康对等方的 别名将
NEW_PEER替换为新对等节点的别名。
验证复制状态。
使用以下命令跟踪复制状态。
mc admin replicate status- 提供复制的总体状态和进度。mc replicate status- 提供桶级和全局复制状态。
主动桶复制重新同步
对于在故障之前已启用 桶复制 的场景,您可以使用 mc replicate resync 将数据恢复到新站点。创建一个新的站点来替换失效的部署,然后将数据从现有的、健康的、启用了桶复制的部署同步到新站点。
部署一个新的 MinIO 站点。
根据需要设置 IAM 和用户。
在包含数据的站点上,使用
mc admin bucket remote add命令创建一个新的remote target,并记录输出中的 ARN。从包含数据的站点上,使用
mc replicate resync start命令以及上一步命令中的 ARN 在新站点上重建桶。等待重新同步完成(使用
mc replicate resync status检查)。从新的 MinIO 站点到现有的目标桶设置桶复制规则。
(可选) 删除目标部署中的桶复制规则以恢复主动-被动复制场景。
被动桶复制重新同步
桶复制 可以通过从目标桶到新的 MinIO 站点执行复制来直接恢复站点内容。
作为一项被动流程,桶复制在站点恢复场景中可能无法像预期那样快速执行。
桶复制依赖于标准复制 扫描器 队列,该队列没有优先于其他流程。对于具有更严格 SLA/SLO 的恢复流程,请使用上述 mc replicate resync 命令的主动桶复制流程。
桶复制规则会将对象、其版本 ID、版本和其他元数据复制到目标桶。如果在站点丢失之前已使用桶复制,MinIO 可以使用所有这些属性将对象恢复到新的 MinIO 站点。
部署一个新的 MinIO 站点。
根据需要设置 IAM 和用户。
在剩余的目标桶部署上,为每个桶创建到新的 MinIO 站点的桶复制规则。
等待复制完成。
从新的 MinIO 站点到现有的目标桶设置桶复制规则。
(可选) 删除目标部署中的桶复制规则以恢复主动-被动复制场景。
如果您希望在桶之间保持主动-主动复制,则不要删除用于恢复数据的部署中的桶复制规则。在主动-主动复制中,对任一位置的对象所做的更改都会影响另一个位置的对象。
镜像
MinIO 的镜像会从任何与 S3 兼容的存储系统复制对象。
镜像仅复制每个对象的最新版本,而不包含版本控制元数据,无论来源如何。您无法使用此方法恢复这些属性。
在您只需要恢复对象的最新版本的情况下,使用 mc mirror。如果您是从另一个 MinIO 部署复制,并且希望恢复对象的版本历史记录和版本元数据,则使用桶复制或站点复制(如果这些方法已在使用中)。
部署一个新的 MinIO 站点。
根据需要设置 IAM 和用户。
在新站点上创建桶。
使用
mc cpCLI 命令将内容从镜像位置复制到新的 MinIO 站点。