硬件清单
在规划生产环境中分布式 MinIO 部署的硬件配置时,请使用以下清单。
注意事项
在为您的 MinIO 实现选择硬件时,请考虑以下因素
启动时要存储的预期数据量(以太字节计算)
至少未来两年的预期数据增长量
按平均对象大小计算的对象数量
数据的平均保留时间(以年为单位)
要部署的站点数量
预期的存储桶数量
生产硬件推荐
以下清单遵循 MinIO 的 推荐配置,用于生产环境部署。提供的指南仅作为基线,不能替代 MinIO SUBNET 性能诊断、架构审查和直接工程支持。
MinIO 就像任何分布式系统一样,从为给定 服务器池 中的所有节点选择相同的配置中获益。确保跨池节点一致选择硬件(CPU、内存、主板、存储适配器)和软件(操作系统、内核设置、系统服务)。
如果节点具有不同的硬件或软件配置,部署可能会表现出不可预测的性能。从将老旧数据存储在更低成本的硬件上获益的工作负载应该改为部署专用的“暖”或“冷”MinIO 部署,并将数据 迁移 到该层。
MinIO 不提供托管服务或硬件销售
请参阅我们的 参考硬件 页面,以了解我们硬件合作伙伴提供的服务器和存储组件的精选列表。
描述 |
最低 |
推荐 |
|
---|---|---|---|
专用裸机或虚拟主机(“主机”)。 |
4 台专用主机 |
8 台及以上专用主机 |
|
每个 MinIO 服务器 4 个驱动器 |
每个 MinIO 服务器 8 个及以上驱动器 |
||
25GbE |
100GbE |
||
支持现代 SIMD 指令 (AVX-512) 的服务器级 CPU,例如 Intel® Xeon® 可扩展或更高版本。 |
每个主机 8 个 CPU/插槽或 vCPU |
每个主机 16 个及以上 CPU/插槽或 vCPU |
|
可用的内存以满足或超过每个服务器的使用量,并留有一定的余量。 |
每个主机 32GB 可用内存 |
每个主机可用内存超过 128GB |
重要
以下方面对 MinIO 性能的影响最大,按重要性排序:
网络基础设施 |
吞吐量不足或有限会限制性能 |
---|---|
存储控制器 |
旧固件、有限的吞吐量或硬件故障会限制性能并影响可靠性 |
存储(驱动器) |
旧固件或缓慢/老化/故障的硬件会限制性能并影响可靠性 |
在关注其他硬件资源(如计算相关的约束)之前,优先确保这些区域中的每个区域都拥有必要的组件。
以上最低建议反映了 MinIO 在帮助企业客户在各种 IT 基础设施上部署 MinIO 同时保持所需 SLA/SLO 的经验。虽然 MinIO 可能在低于最低建议拓扑的配置上运行,但任何潜在的成本节约都伴随着可靠性、性能或整体功能降低的风险。
网络
MinIO 建议使用高速网络来支持连接的存储(聚合驱动器、存储控制器和 PCIe 总线)的最大吞吐量。下表提供了给定物理或虚拟网络接口支持的最大存储吞吐量的通用指南。该表假设所有网络基础设施组件(如路由器、交换机和物理布线)也支持 NIC 带宽。
NIC 带宽 (Gbps) |
估计的聚合存储吞吐量 (GBps) |
10Gbps |
1.25GBps |
25Gbps |
3.125GBps |
50Gbps |
6.25GBps |
100Gbps |
12.5GBps |
网络对 MinIO 性能的影响最大,低主机带宽会人为地限制存储的潜在性能。以下网络吞吐量限制示例假设旋转磁盘具有约 100MB/S 的持续 I/O
1GbE 网络链路最多可支持 125MB/s,或一个旋转磁盘
10GbE 网络可支持约 1.25GB/s,可能支持 10-12 个旋转磁盘
25GbE 网络可支持约 3.125GB/s,可能支持约 30 个旋转磁盘
内存
内存主要限制每个节点的并发连接数。
您可以使用以下公式计算每个节点的最大并发请求数
\(totalRam / ramPerRequest\)
要计算每个请求使用的 RAM 量,请使用以下公式
\(((2MiB + 128KiB) * driveCount) + (2 * 10MiB) + (2 * 1 MiB)\)
10MiB 是默认的擦除块大小 v1。1 MiB 是默认的擦除块大小 v2。
下表列出了基于主机驱动器数量和可用系统 RAM 的节点上的最大并发请求
驱动器数量 |
32 GiB RAM |
64 GiB RAM |
128 GiB RAM |
256 GiB RAM |
512 GiB RAM |
---|---|---|---|---|---|
4 个驱动器 |
1,074 |
2,149 |
4,297 |
8,595 |
17,190 |
8 个驱动器 |
840 |
1,680 |
3,361 |
6,722 |
13,443 |
16 个驱动器 |
585 |
1,170 |
2.341 |
4,681 |
9,362 |
下表提供了基于节点上的总本地存储量分配用于 MinIO 的内存的通用指南
总主机存储 |
推荐的主机内存 |
---|---|
最多 1 Tebibyte (Ti) |
8GiB |
最多 10 Tebibyte (Ti) |
16GiB |
最多 100 Tebibyte (Ti) |
32GiB |
最多 1 Pebibyte (Pi) |
64GiB |
超过 1 Pebibyte (Pi) |
128GiB |
重要
从 RELEASE.2024-01-28T22-35-53Z 开始,MinIO 在分布式设置中为每个节点预分配 2GiB 内存,为单节点设置预分配 1GiB 内存。
存储
对驱动器的独占访问
MinIO 需要对用于对象存储的驱动器或卷进行独占访问。任何其他进程、软件、脚本或人员不应对提供给 MinIO 的驱动器或卷或 MinIO 放置在这些驱动器或卷上的对象或文件执行任何操作。
除非 MinIO 工程师指示,否则不要使用脚本或工具直接修改、删除或移动提供给驱动器的任何数据分片、奇偶校验分片或元数据文件,包括从一个驱动器或节点移动到另一个驱动器或节点。此类操作很可能导致广泛的损坏和数据丢失,超出了 MinIO 的修复能力。
推荐的存储介质
MinIO 建议对所有工作负载类型和规模使用基于闪存的存储(NVMe 或 SSD)。需要高性能的工作负载应该优先选择 NVMe 而不是 SSD。
使用基于 HDD 的存储的 MinIO 部署最适合作为 对象转换(“分层”) 过时数据的冷层目标。HDD 存储通常无法提供满足现代工作负载期望的性能,任何规模上的成本效益都会因介质的性能限制而抵消。
使用直连式“本地”存储 (DAS)
DAS(例如本地连接的 JBOD(Just a Bunch of Disks)阵列)与网络存储(NAS、SAN、NFS)相比,在性能和一致性方面具有显著优势。
网络文件系统卷破坏一致性保证
MinIO 的严格写后读和写后列出一致性模型需要本地驱动器文件系统。如果底层存储卷是 NFS 或类似的网络连接存储卷,MinIO 无法提供一致性保证。
使用带有标签的 XFS 格式化驱动器
将驱动器格式化为 XFS,并将它们作为 JBOD 阵列呈现给 MinIO,不使用 RAID 或其他合并配置。使用任何其他类型的后备存储(SAN/NAS、ext4、RAID、LVM)通常会导致性能、可靠性、可预测性和一致性降低。
格式化 XFS 驱动器时,请为每个驱动器应用一个唯一的标签。例如,以下命令将四个驱动器格式化为 XFS 并应用相应的驱动器标签。
mkfs.xfs /dev/sdb -L MINIODRIVE1
mkfs.xfs /dev/sdc -L MINIODRIVE2
mkfs.xfs /dev/sdd -L MINIODRIVE3
mkfs.xfs /dev/sde -L MINIODRIVE4
使用 /etc/fstab
安装驱动器
MinIO 需要驱动器在重启时保持其安装位置的排序。MinIO 不支持将具有现有 MinIO 数据的驱动器任意迁移到新的安装位置,无论是故意的还是由于操作系统级别的行为导致的。
您必须使用 /etc/fstab
或类似的安装控制系统来安装驱动器,以保持一致的路径。例如
$ nano /etc/fstab
# <file system> <mount point> <type> <options> <dump> <pass>
LABEL=MINIODRIVE1 /mnt/drive-1 xfs defaults,noatime 0 2
LABEL=MINIODRIVE2 /mnt/drive-2 xfs defaults,noatime 0 2
LABEL=MINIODRIVE3 /mnt/drive-3 xfs defaults,noatime 0 2
LABEL=MINIODRIVE4 /mnt/drive-4 xfs defaults,noatime 0 2
您可以在初始设置期间使用 mount -a
在这些路径上安装这些驱动器。操作系统应该在节点启动过程中安装这些驱动器。
MinIO 强烈建议使用基于标签的安装规则而不是基于 UUID 的规则。基于标签的规则允许使用具有匹配格式和标签的替换驱动器来替换不健康或无法正常工作的驱动器。基于 UUID 的规则需要编辑 /etc/fstab
文件,以将映射替换为新的驱动器 UUID。
注意
依赖于安装的外部存储的云环境实例,如果一个或多个远程文件安装返回错误或故障,可能会遇到启动故障。例如,如果一个或多个 EBS 卷无法安装,则具有安装的持久 EBS 卷的 AWS ECS 实例可能无法使用标准 /etc/fstab
配置启动。
您可以设置 nofail
选项以在启动时静默错误报告,并允许实例在存在一个或多个安装问题的情况下启动。
您不应在具有本地连接磁盘的系统上使用此选项,因为静默驱动器错误会阻止 MinIO 和操作系统正常响应这些错误。
禁用 XFS 错误重试
MinIO 强烈建议使用 max_retries
配置禁用 错误重试 行为,以解决以下错误类别
EIO
读取或写入时发生错误ENOSPC
设备上没有空间default
所有其他错误
默认的 max_retries
设置通常会指示文件系统无限期地重试错误,而不是传播错误。MinIO 可以适当地处理 XFS 错误,因此错误重试行为最多会引入不必要的延迟或性能下降。
以下脚本遍历指定安装路径下的所有驱动器,并将 XFS max_retries
设置设置为 0
或“立即在发生错误时失败”,以解决推荐的错误类别。该脚本会忽略任何未安装的驱动器,无论是手动安装还是通过 /etc/fstab
安装的。修改 /mnt/drive
行,使其与 MinIO 驱动器使用的模式匹配。
#!/bin/bash
for i in $(df -h | grep /mnt/drive | awk '{ print $1 }'); do
mountPath="$(df -h | grep $i | awk '{ print $6 }')"
deviceName="$(basename $i)"
echo "Modifying xfs max_retries and retry_timeout_seconds for drive $i mounted at $mountPath"
echo 0 > /sys/fs/xfs/$deviceName/error/metadata/EIO/max_retries
echo 0 > /sys/fs/xfs/$deviceName/error/metadata/ENOSPC/max_retries
echo 0 > /sys/fs/xfs/$deviceName/error/metadata/default/max_retries
done
exit 0
您必须在所有 MinIO 节点上运行此脚本,并将脚本配置为在重新启动时重新运行,因为 Linux 操作系统通常不会保留这些更改。您可以使用 cron
作业,并使用 @reboot
定时器在节点重新启动时运行上述脚本,并确保所有驱动器都已禁用重试错误。使用 crontab -e
创建以下作业,修改脚本路径以匹配每个节点上的路径
@reboot /opt/minio/xfs-retry-settings.sh
使用一致的驱动器类型和容量
确保在 MinIO 部署中为基础存储使用一致的驱动器类型(NVMe、SSD、HDD)。MinIO 不区分存储类型,也不支持在单个部署中配置“热”或“温”驱动器。混合驱动器类型通常会导致性能下降,因为部署中最慢的驱动器会成为瓶颈,而不管速度更快的驱动器的功能如何。
在每个 MinIO 服务器池中,所有节点都使用相同容量和类型的驱动器。MinIO 将每个驱动器的最大可用大小限制为部署中最小的尺寸。例如,如果部署中有 15 个 10TB 驱动器和 1 个 1TB 驱动器,则 MinIO 将每个驱动器的容量限制为 1TB。
推荐的硬件测试
MinIO 诊断
运行内置的健康诊断工具。如果您有权访问 SUBNET,您可以将结果上传到那里。
mc support diag ALIAS --airgap
将 ALIAS 替换为为部署定义的 alias
。
MinIO 支持诊断工具
对于已注册 MinIO SUBNET 的部署,您可以运行内置的支持诊断工具。
运行三个 mc support perf
测试。
这些服务器端测试验证网络、驱动器和对象吞吐量。使用默认选项运行所有三个测试。
网络测试
在别名为
minio1
的集群上运行网络吞吐量测试。mc support perf net minio1
驱动器测试
在别名为
minio1
的集群中,对所有节点上的所有驱动器运行驱动器读/写性能测量。该命令使用默认的 4MiB 块大小。mc support perf drive minio1
对象测试
测量别名为
minio1
的对象上的 S3 读/写性能。MinIO 自动调整并发性以获得最大吞吐量和 IOPS(每秒输入/输出操作)。mc support perf object minio1
操作系统诊断工具
如果您无法运行 mc support diag
或结果显示意外结果,您可以使用操作系统的默认工具。
独立测试所有服务器上的每个驱动器,以确保它们在性能上是相同的。使用这些操作系统级工具的结果来验证存储硬件的功能。记录结果以供将来参考。
测试驱动器在写入操作期间的性能
此测试通过创建指定数量的块(每次最多一定数量的字节)来模拟驱动器在写入未缓存数据时的功能,从而检查驱动器将新数据(未缓存)写入驱动器的能力。这使您可以看到驱动器在一致的文件 I/O 时的实际性能。
dd if=/dev/zero of=/mnt/driveN/testfile bs=128k count=80000 oflag=direct conv=fdatasync > dd-write-drive1.txt
将
driveN
替换为要测试的驱动器的路径。dd
用于复制和粘贴数据的命令。
if=/dev/zero
从
/dev/zero
读取,这是一个系统生成的无限 0 字节流,用于创建指定大小的文件of=/mnt/driveN/testfile
写入
/mnt/driveN/testfile
bs=128k
一次写入最多 128,000 字节
count=80000
写入最多 80000 个数据块
oflag=direct
使用直接 I/O 写入以避免数据来自缓存
conv=fdatasync
在完成之前物理写入输出文件数据
> dd-write-drive1.txt
将操作输出的内容写入当前工作目录中的
dd-write-drive1.txt
该操作返回已写入的文件数量、已写入的总大小(以字节为单位)、操作的总持续时间(以秒为单位)以及写入速度(以每秒字节为单位)。
测试驱动器在读取操作期间的性能
dd if=/mnt/driveN/testfile of=/dev/null bs=128k iflag=direct > dd-read-drive1.txt
将
driveN
替换为要测试的驱动器的路径。dd
用于复制和粘贴数据的命令
if=/mnt/driveN/testfile
从
/mnt/driveN/testfile
读取;替换为要用于测试驱动器读取性能的文件的路径of=/dev/null
写入
/dev/null
,这是一个虚拟文件,在操作完成后不会保留bs=128k
一次写入最多 128,000 字节
count=80000
写入最多 80000 个数据块
iflag=direct
使用直接 I/O 读取并避免数据来自缓存
> dd-read-drive1.txt
将操作输出的内容写入当前工作目录中的
dd-read-drive1.txt
使用一个足够大的文件来模拟部署的主要用例,以获得准确的读取测试结果。
以下指南可能有助于性能测试
小文件:< 128KB
普通文件:128KB – 1GB
大文件:> 1GB
您可以使用
head
命令来创建一个要使用的文件。以下命令示例创建一个名为testfile
的 10GB 文件。head -c 10G </dev/urandom > testfile
该操作返回已读取的文件数量、已读取的总大小(以字节为单位)、操作的总持续时间(以秒为单位)以及读取速度(以每秒字节为单位)。
第三方诊断工具
IO 控制器测试
使用 IOzone 测试输入/输出控制器和所有驱动器组合。记录部署中每个服务器的性能数据。
iozone -s 1g -r 4m -i 0 -i 1 -i 2 -I -t 160 -F /mnt/sdb1/tmpfile.{1..16} /mnt/sdc1/tmpfile.{1..16} /mnt/sdd1/tmpfile.{1..16} /mnt/sde1/tmpfile.{1..16} /mnt/sdf1/tmpfile.{1..16} /mnt/sdg1/tmpfile.{1..16} /mnt/sdh1/tmpfile.{1..16} /mnt/sdi1/tmpfile.{1..16} /mnt/sdj1/tmpfile.{1..16} /mnt/sdk1/tmpfile.{1..16} > iozone.txt
|
每个文件的大小为 1G |
|
4m 4MB 块大小 |
|
0=写入/重写,1=读取/重新读取,2=随机读/写 |
|
直接-IO 现代 |
|
线程数 (\(numberOfDrives * 16\)) |
|
文件列表(以上命令使用每个驱动器 16 个文件进行测试) |