文档

从远程副本重新同步存储桶

此页面上的过程使用健康的复制远程端来重新同步 MinIO 存储桶的内容。重新同步支持在副本配置中的 MinIO 部署中部分或完全丢失数据后的恢复。

例如,考虑一个类似于以下内容的 MinIO 活动-活动复制配置

Active-Active Replication synchronizes data between two remote deployments.

重新同步允许使用参与的 MinIO 部署之一上的健康数据作为重建另一个部署的数据源。

重新同步是一个按存储桶进行的过程。您必须对远程端上每个部分或完全丢失数据的存储桶重复重新同步操作。

BC/DR 操作期间的专业支持

MinIO SUBNET 用户可以 登录 并创建一个与重新同步相关的新问题。通过 SUBNET 与 MinIO 工程团队的协调可以确保成功重新同步和恢复正常操作,包括性能测试和健康诊断。

社区用户可以在 MinIO 社区 Slack 上寻求支持。社区支持仅限于尽力而为,并且没有关于响应能力的 SLA。

要求

MinIO 部署必须在线

重新同步要求源部署和目标部署都必须在线并且能够接受读写操作。源端 *必须* 与远程端具有完全的网络连接。

远程部署可能“不健康”,因为它已部分或完全丢失数据。只要源端和目标端都保持连接,重新同步就可以解决数据丢失问题。

重新同步需要现有的复制配置

重新同步需要健康的源部署具有目标存储桶的现有复制配置。此外,重新同步仅适用于使用现有对象复制选项创建的复制规则。

使用mc replicate ls查看健康源存储桶的已配置复制规则和目标。

复制需要匹配的对象加密设置

MinIO 支持使用SSE-KMSSSE-S3加密的对象的复制。

  • 对于使用 SSE-KMS 加密的对象,MinIO要求目标存储桶支持使用与源存储桶上加密对象相同的密钥名称对对象进行 SSE-KMS 加密。

  • 对于使用SSE-S3加密的对象,MinIO要求目标存储桶也支持 SSE-S3 加密对象,无论密钥名称如何。

作为复制过程的一部分,MinIO解密源存储桶上的对象,并将未加密的对象通过网络传输。目标 MinIO 部署然后使用目标的加密设置重新加密对象。因此,MinIO强烈建议在源和目标部署上启用 TLS,以确保对象在传输过程中的安全性。

MinIO不支持复制客户端加密的对象 (SSE-C)。

复制需要 MinIO 部署

MinIO 服务器端复制仅在 MinIO 部署之间工作。源和目标部署必须运行具有匹配版本的 MinIO 服务器。

要配置任意与 S3 兼容的服务之间的复制,请使用mc mirror

复制需要版本控制

MinIO 依靠版本控制提供的不可变性保护来支持复制和重新同步。

使用mc version info验证源和远程存储桶的版本控制状态。使用mc version enable命令根据需要启用版本控制。

如果从源存储桶中的版本控制中排除前缀或文件夹,则 MinIO 无法复制该文件夹或前缀中的对象。

复制需要匹配的对象锁定状态

MinIO 支持复制在WORM 锁定下保存的对象。两个复制存储桶必须都启用对象锁定,MinIO 才能复制锁定的对象。对于活动-活动配置,MinIO 建议在两个存储桶上使用相同的保留规则,以确保跨站点的一致行为。

您必须在创建存储桶时启用对象锁定,这与 S3 的行为一致。然后,您可以随时配置对象保留规则。在开始此过程之前,请在不健康的的目标存储桶上配置必要的规则。

注意事项

重新同步需要时间

重新同步是一个后台进程,它会持续检查源 MinIO 存储桶中的对象,并在需要时将其复制到远程。复制完成所需的时间可能因对象的数量和大小、到远程 MinIO 部署的吞吐量以及源 MinIO 部署上的负载而异。由于这些变量,完成的总时间通常是不可预测的。

MinIO 建议配置负载均衡器或代理,以仅将流量定向到健康集群,直到同步完成。以下命令可以提供有关重新同步状态的见解

  • 在源上运行mc replicate resync status以跟踪重新同步进度。

  • 在源和远程上运行mc replicate status以跟踪正常的复制数据。

  • 针对源和远程都运行mc ls -r --versions ALIAS/BUCKET | wc -l,以验证每个对象上的对象和对象版本的总数。

数据丢失后重新同步对象

此过程使用现有的MinIO 复制配置将丢失的数据恢复到参与该配置的 MinIO 部署之一。具体来说,一个健康的 MinIO 部署(SOURCE)将其现有数据同步到不健康的 MinIO 部署(TARGET)。

此过程假设SOURCE具有现有的别名,并且具有必要的权限来配置复制。

您可以对每个需要重新同步的存储桶重复此过程。每个存储桶最多只能运行一个复制作业。

1) 列出健康源上的已配置复制目标

运行mc replicate ls命令以列出健康SOURCE部署上需要重新同步的BUCKET的已配置远程目标。

mc replicate ls SOURCE/BUCKET --json
  • SOURCE替换为源 MinIO 部署的别名

  • BUCKET替换为用作重新同步源的存储桶的名称。

输出类似于以下内容

{
   "op": "",
   "status": "success",
   "url": "",
   "rule": {
      "ID": "cer1tuk9a3p5j68crk60",
      "Status": "Enabled",
      "Priority": 0,
      "DeleteMarkerReplication": {
         "Status": "Enabled"
      },
      "DeleteReplication": {
         "Status": "Enabled"
      },
      "Destination": {
         "Bucket": "arn:minio:replication::UUID:BUCKET"
      },
      "Filter": {
         "And": {},
         "Tag": {}
      },
      "SourceSelectionCriteria": {
         "ReplicaModifications": {
            "Status": "Enabled"
         }
      },
      "ExistingObjectReplication": {
         "Status": "Enabled"
      }
   }
}

输出中的每个文档都代表一个已配置的复制规则。Destination.Bucket字段指定存储桶上给定规则的 ARN。确定要从中重新同步对象的存储桶的正确 ARN。

2) 启动重新同步过程

运行mc replicate resync start命令以开始重新同步过程

mc replicate resync start --remote-bucket "arn:minio:replication::UUID:BUCKET" SOURCE/BUCKET
  • --remote-bucket值替换为TARGET MinIO 部署上不健康的BUCKET的 ARN。

  • SOURCE替换为源 MinIO 部署的别名

  • BUCKET替换为健康SOURCE MinIO 部署上存储桶的名称。

该命令返回一个重新同步作业 ID,指示该过程已开始。

3) 监控重新同步

在源部署上使用mc replicate resync status命令跟踪接收到的复制数据

mc replicate resync status ALIAS/BUCKET

输出类似于以下内容

mc replicate resync status /data
Resync status summary:
● arn:minio:replication::6593d572-4dc3-4bb9-8d90-7f79cc612f01:data
   Status: Ongoing
   Replication Status | Size (Bytes)    | Count
   Replicated         | 2.3 GiB         | 18
   Failed             | 0 B             | 0

重新同步过程完成后,状态更新为Completed

4) 下一步

  • 如果 TARGET 桶的损坏影响到复制规则,则必须重新创建这些规则以匹配之前的复制配置。有关更多指导,请参阅启用双向服务器端桶复制

  • 执行基本验证,以确保复制配置中的所有桶在使用诸如mc lsmc stat的命令时显示类似的结果。

  • 在恢复任何复制规则并验证站点之间的复制后,您可以配置反向代理、负载均衡器或其他管理连接的网络控制平面,以恢复将流量发送到已重新同步的部署。