Intel Virtual RAID on CPU (VROC) 评测

您所在的位置:网站首页 m2阵列提升大吗 Intel Virtual RAID on CPU (VROC) 评测

Intel Virtual RAID on CPU (VROC) 评测

2024-07-04 00:03| 来源: 网络整理| 查看: 265

NVMe SSD 正在接管数据中心,迅速巩固自己作为关键任务应用程序的首选技术的地位。 NVMe 接口让闪存自由运行,克服了 SATA 和 SAS 接口的遗留瓶颈。 尽管移除闪存闸门会带来新的架构挑战,但传统的 HBA/RAID 卡服务器布局无法轻松解决这些挑战。 英特尔通过简化的解决方案解决了这个问题,用于管理服务器中的 NVMe SSD。 CPU 上的虚拟 RAID,或简称为英特尔 VROC,本质上允许 SSD 直接访问 CPU,从而完全消除了对 HBA 的需求。 这大大简化了在服务器中充分利用 NVMe SSD 所需的数据路径和组件。 除了企业级 RAID 之外,英特尔 VROC 还包括企业所需的预期可维护性,包括预启动 RAID 管理、热插拔支持和 LED 管理。

NVMe SSD 正在接管数据中心,迅速巩固自己作为关键任务应用程序的首选技术的地位。 NVMe 接口让闪存自由运行,克服了 SATA 和 SAS 接口的遗留瓶颈。 尽管移除闪存闸门会带来新的架构挑战,但传统的 HBA/RAID 卡服务器布局无法轻松解决这些挑战。 英特尔通过简化的解决方案解决了这个问题,用于管理服务器中的 NVMe SSD。 CPU 上的虚拟 RAID,或简称为英特尔 VROC,本质上允许 SSD 直接访问 CPU,从而完全消除了对 HBA 的需求。 这大大简化了在服务器中充分利用 NVMe SSD 所需的数据路径和组件。 除了企业级 RAID 之外,英特尔 VROC 还包括企业所需的预期可维护性,包括预启动 RAID 管理、热插拔支持和 LED 管理。

英特尔 VROC 架构概述

为了更好地了解英特尔 VROC,了解另一种称为英特尔卷管理设备 (英特尔 VMD) 的技术非常重要。 Intel VMD 与最新的 Intel Xeon 可扩展处理器兼容,是 CPU PCIe 根复合体中的集成控制器。 最终结果是英特尔 VMD 为连接的 NVMe SSD 启用或多或少的虚拟 HBA。 这一点很重要,因为英特尔 VMD 提供了关键的驱动器可维护性功能,这些功能在不牺牲可靠性的情况下得到了简化。 得益于 Intel VMD,NVMe SSD 可以在不中断服务或重启的情况下进行热插拔。 英特尔 VMD 将插入和移除 PCIe 总线事件重定向到处理这些事件的 RAID 存储感知驱动程序,并将启动自动重建。 如果发生故障,知道要移除哪个驱动器也很重要,这在拥有数十个或数百个驱动器且供应商驱动器托架标签做法不一致的数据中心可能很困难。 Intel VMD 支持 NVMe LED Management,符合 SATA 和 SAS 驱动器使用多年的驱动器灯规格,便于在需要时识别和维护 SSD。 Intel VMD 在业界也得到广泛支持,例如 VMware 在 VMware ESXi 6.7 版本中原生支持 Intel VMD NVMe 驱动程序,其中包括对在 vSAN 中管理 NVMe SSD 的支持。

英特尔 VROC 基于英特尔 VMD 构建,将 NVMe SSD RAID 引入画面。 目前,单个至强可扩展 CPU 最多可支持 12 个 NVMe 直连驱动器和最多 6 个 RAID 阵列。 双进程系统将分别支持 24 和 12。 然而,一个 CPU 可以利用交换机在一个系统中支持多达 48 个 SSD。 英特尔 VROC 支持数据卷和引导卷,这在历史上是 NVMe 驱动器难以实现的。 RAID 设置可通过 BIOS 或 CLI 配置,英特尔支持本地管理或通过 RESTful 代理远程管理。

英特尔 VROC 作为物理密钥出售; 提供三个 SKU。 标准支持 RAID 0/1/10 和第 3 方 SSD 支持。 Premium 许可证增加了对 RAID5 的支持。 还有一个 Intel SSD Only 许可证,顾名思义,它仅支持 Intel 驱动器,但提供完整的 RAID 选项。

除了许可证、NVMe SSD 和 Xeon Scalable CPU 之外,还需要兼容的服务器。 虽然英特尔 VROC 得到广泛支持,但有些服务器供应商更喜欢他们自己的基于卡的技术来管理驱动器,而不是这种更现代的替代方案。 在这篇评论中,我们与 EchoStreams 合作,后者在其存储服务器产品线中支持英特尔 VROC。的

对于这么小的盒子, EchoStreams FlacheSAN1N10U-D5 非常灵活。 在我们的配置中,服务器配备了双 Intel 8180M CPU、64GB RAM 和八个 2TB 英特尔 DC P4510 NVMe 固态硬盘. 该服务器提供三个 x16 PCIe 3.0 插槽,允许用户通过高达 160TB 的 NVMe 闪存(10 个 16TB SSD)和三个 100Gbps 以太网 NIC 最大限度地发挥内部存储容量的全部潜力。

机箱设计还允许在两个 CPU、NVMe SSD 和出站 NIC 之间进行对称布局。 作为一款白盒产品,该机箱还可以为最终用户定制,支持其他 SSD 尺寸,如 15mm 和 7mm U.2 以及内部 M.2 SSD 和 Intel Optane。 最后,服务器可以配置双 850W 交流电源,或设置为支持 48VDC 高效电源。 考虑到我们配置中的高端英特尔 CPU,更大的电源就派上用场了。

看看 FlacheSAN1N10U-D5 可以在哪里增加价值,EchoStreams 将内容分发网络 (CDN) 作为主要用例。 目前,客户将这些节点用作数据中心或边缘位置的缓存设备,以向最终用户提供流行的内容。 还有几所大学将该平台用于 HPC 和研究用途,其中计算能力和存储吞吐量在解决复杂问题方面提供了关键优势。 除了这些场景之外,该服务器还适用于媒体和娱乐后期制作工作流程,并且还可以与可以从 NVMe 存储和高速网络中受益的软件定义存储产品完美搭配。

EchoStreams FlacheSAN1N10U-UN 规格 外形尺寸 1U 中央处理器 支持双路 LGA3647 英特尔至强可扩展处理器 芯片组 英特尔C622 内存 DDR4 高达 1.5TB RDIMM/RDIMM/LRDIMM 2666/2400 MHz DIMM 插槽 最高 16 驱动器托架 8 个 2.5” 热插拔 U.2 NVMe 2 个用于操作系统驱动器的内部 M.2 NVMe I / O接口 2x的USB 3.0端口 1x VGA 接口 1x 串口 2 个 1GbE 端口 1x 1GbE 管理器 扩展插槽 2x PCIe Gen3 x16 全高半长 1 个 PCIe Gen3 x16 OCP 2.0 背板 5 x 2-Bay NVMe 背板 支持的操作系统 微软视窗服务器 64 位 2012/R2 Windows 2016 64bit的 Linux RHEL 7.4 SUSE 11 SP4 x64, SUSE 12 SP2 x64 Ubuntu 16.04 x64 Ubuntu 17.04 x64 电力 1+1个850W AC/DC或-48VDC/DC高效冗余电源 5 个 40 毫米风扇,带智能风扇控制 物理 长 x 宽 x 高 27”x19”x1.75” 重量 35 磅(不含驱动器) 环境 工作温度:0°C至35°C 非工作温度:-20°C 至 70°C 湿度:5%至95%,无冷凝 可用性和部署

该主板没有用于配置英特尔 VROC 的花哨 GUI,但它确实对用户友好。 对于可能熟悉从控制台使用 mdadm 命令的 IT 管理员,英特尔 VROC 可自动执行大部分后端工作以简化设置。 虽然没有花里胡哨的东西,但对于大多数 IT 专业人员来说,使用起来并不困难。 在 BIOS 屏幕上,用户可以设置他们的 RAID 卷,同时看到可用的物理磁盘。

接下来,可以命名卷(在本例中为 volume0),选择 RAID 级别,并启用跨越两个 Intel VMD 控制器的 RAID。

设置 RAID 后,可以查看卷操作,例如删除 RAID 卷或使其可启动。

最后,用户可以执行磁盘操作,例如重置为非 RAID 或从磁盘中删除 RAID 数据。

一旦系统在我们的 CentOS 7.4 环境中启动并运行,RAID 卷的配置就准备就绪并等待。 对于 RAID5/10 卷,您可以查看 mdstat 以了解后台初始化进度,或者如果您愿意,可以手动更改整个 RAID 组。 BIOS 级别设置消除了启动和运行 RAID 的大部分工作,但不会为需要额外级别自定义的用户删除或替换它。

性能

VDBench 工作负载分析

在对存储阵列进行基准测试时,应用程序测试是最好的,综合测试排在第二位。 虽然不能完美代表实际工作负载,但综合测试确实有助于为具有可重复性因素的存储设备建立基线,从而可以轻松地在竞争解决方案之间进行同类比较。 这些工作负载提供了一系列不同的测试配置文件,包括“四个角”测试、常见的数据库传输大小测试,以及来自不同 VDI 环境的跟踪捕获。 所有这些测试都利用通用的 vdBench 工作负载生成器,以及一个脚本引擎来自动化和捕获大型计算测试集群的结果。 这使我们能够在各种存储设备上重复相同的工作负载,包括闪存阵列和单个存储设备。

简介:

4K 随机读取:100% 读取,128 个线程,0-120% 重复率 4K 随机写入:100% 写入,64 线程,0-120% iorate 64K 顺序读取:100% 读取,16 线程,0-120% 迭代 64K 顺序写入:100% 写入,8 个线程,0-120% 迭代 综合数据库:SQL 和 Oracle VDI 完整克隆和链接克隆跟踪

对于这一系列的 VDBench 测试,我们将运行我们的正常测试,而不是一个设备(例如 SSD、服务器或阵列),我们将在两个 CPU 上平衡运行多个配置:

JBOD 中有 8 个驱动器 RAID0 中的两组 XNUMX 个 SSD RAID5 中的两组 XNUMX 个 SSD RAID10 中的两组 XNUMX 个 SSD

下面显示的数据是每个配置中使用的 8 个 SSD 的总和。 此数据只是为了强调此平台在英特尔 VROC 支持的各种配置中的能力。 应该注意的是,由于奇偶校验计算和更新的复杂性,RAID5 在本次审查中发布了较低的写入性能,并且基于 RAID 级别比较是预期的。

对于 4K 峰值随机性能,所有 RAID 组的延迟都能够保持在 1 毫秒以下(事实上,所有组都在 210 微秒以下)。 所有组的 IOPS 都在 2.5 万到 3 万之间,JBOD 组的性能最高,为 2,944,335 IOPS,延迟为 163 微秒。 4K 随机写入在不同的 RAID 组中没有看到相同的统一性。 RAID5 组的性能最低,峰值为 21,921 IOPS,延迟为 936.7 毫秒。 其他 RAID 组表现更好,RAID0 组峰值为 1,879,180 IOPS,延迟为 1.35 毫秒。

切换到顺序工作负载时,64K 读取显示所有 RAID 组都以亚毫秒级延迟开始,只有 JBOD 在 1K IOPS 或 330GB/s 时超过 22ms,峰值为 363,203 IOPS 或 22.7GB/s,延迟仅为 1.4多发性硬化症。

再次写入时,RAID 组分解,提供非常不同的性能。 RAID5 组再次减少了约 25K IOPS,延迟为 4.3ms,RAID0 继续达到 124,104 IOPS,延迟为 958μs。

接下来是我们的 SQL 工作负载。 所有 RAID 组都具有亚毫秒级延迟性能,直到大约 1.4 万 IOPS。 在这里,RAID5 组的延迟达到峰值,性能下降。 其他三组继续不到 1 毫秒,直到他们都突破 2 万 IOPS。 最高数字再次授予 RAID0 组,其峰值性能为 2,519,727 IOPS,延迟为 1.45 毫秒。

对于 SQL 90-10,我们看到 RAID5 组的延迟曲线更好,峰值为 302μs,但其峰值性能仅为 436,439 IOPS。 其他组在突破 1.5 毫秒之前达到了超过 1 万次 IOPS,JBOD 和 RAID10 组均在此后不久达到峰值。 RAID0 组的峰值为 2,135,362 IOPS,延迟为 1.54 毫秒。

再一次在 SQL 80-20 中,RAID5 组具有亚毫秒级延迟,与其他组相比性能较低,为 345μs 至 212,980 IOPS。 其他组在 1 毫秒以下通过了 1 万次 IOPS,JBOD 和 RAID10 不久后再次达到峰值,而 RAID0 在 1,753,622 IOPS 的延迟为 1.7 毫秒时达到峰值。

不出所料,我们的 Oracle 基准测试给了我们与上述类似的排名。 RAID5 组首先达到 61,695 IOPS 的峰值,延迟为 153μs。 在 RAID780 突破并达到峰值(1 IOPS,延迟为 10 毫秒)之前,其他驱动器在不到 954,567 毫秒的时间内一起达到了大约 2.63K IOPS,其次是 JBOD(峰值为 1,274,172 IOPS,延迟为 4.2 毫秒),并且最后是 RAID0 组,峰值为 1,472,338 IOPS,延迟为 2.18 毫秒。

Oracle 90-10 以 5 IOPS 和 406,693μs 的延迟在 RAID255 组中排名第一。 其他组在超过 1.5 万 IOPS 之前具有亚毫秒延迟,并以我们所看到的相同方式达到峰值:RAID10、JBOD 和 RAID0 以 2,110,799 IOPS 和 1.55 毫秒的延迟位居榜首。

对于 Oracle 80-20,RAID5 组的峰值为 213,479 IOPS,延迟为 327μs。 其他组达到了超过 1 万的 IOPS,然后 RAID0 在不到 1.65 毫秒的时间内达到了 1 万 IOPS,并达到了 1,757,722 IOPS 的峰值,延迟为 1.63 毫秒。

接下来,我们切换到我们的 VDI 克隆测试,完整和链接。 在这里,我们继续看到不同 RAID 组的相同熟悉放置模式:RAID5、RAID10、JBOD 和 RAID0。 对于 VDI 完整克隆启动,RAID5 组的峰值为 288,613 IOPS,延迟为 182μs。 其他组以亚毫秒延迟达到近 1.2 万次 IOPS,首先 RAID10 组达到 1,217,620 IOPS,延迟为 2.65 毫秒,其次是 JBOD 组,达到 1,314,075 IOPS,延迟为 4.19 毫秒,然后是 RAID0 组,达到 1,400,765 IOPS延迟为 2.22 毫秒。

使用 VDI FC 初始登录时,RAID5 组的运行峰值非常短,达到 13,296 IOPS 和 286μs 的延迟。 其他驱动器在突破 175 毫秒之前达到了 1K IOPS。 RAID0 组一直达到 390K IOPS,延迟为亚毫秒,峰值为 429,692 IOPS,延迟为 4.98 毫秒。

使用 VDI FC Monday 登录时,RAID5 组在 15μs 时达到 262K IOPS 的峰值。 其他 RAID 组在突破 150ms 之前超过了 1K,RAID10 组和 JBOD 分别看到相当高的延迟 12.8ms 和 11.7ms,尽管性能令人印象深刻,分别为 234,431 IOPS 和 341,483 IOPS。 RAID0 组的整体性能最好,为 435,641 IOPS,延迟为 5.67 毫秒。

切换到我们的 VDI 链接克隆测试,我们看到启动时所有组的性能都更强,RAID5 组峰值为 543,680 IOPS 和 407μs 延迟,RAID10 峰值为 782,224,延迟为 4.76 毫秒,JBOD 峰值为 822,555 IOPS,延迟为 11.52 毫秒,以及RAID0 峰值为 820,998 IOPS,延迟为 4.39 毫秒。

通过 VDI LC 初始登录,我们看到峰值性能从 RAID10,998 的 312 IOPS 和 5μs 延迟到 RAID276,814 的 7.88 IOPS 和 0ms 延迟。

最后,在 VDI LC Monday Login 中,我们继续看到 RAID5 的模式首先完成(在 11,591μs 时为 315 IOPS),然后是 RAID10(在 155ms 峰值时大约为 1.2K IOPS),然后是 JBOD(在 238ms 峰值时大约为 15.8K IOPS),最后是 RAID0( 279,332 毫秒时为 8.06 次 IOPS)。

结论

查看此 1U EchoStreams 平台上的英特尔 VROC 性能,我们查看了四个不同的测试组,每个测试组使用来自 8 倍英特尔 P4510 NVMe SSD 的聚合数据。 很容易将 RAID0 宣布为组中的“赢家”,但由于 RAID 的工作方式,这是出于预期的原因。 从下往上看性能结果; 正如一开始所指出的,RAID5 具有奇偶校验计算的严重数据冗余损失,并且清楚地反映在数据中。 RAID10使用镜像,因此冗余损失要低得多,因此与RAID5相比,结果有了很大的飞跃。 该组之后是 JBOD,具有综合直通性能。 RAID0 领先于数字,因为它只关注性能并利用通过数据条带化协同工作的驱动器,但牺牲了数据弹性。 从 RAID 功能的角度来看,所有数据都支持英特尔 VROC 实施良好并在精心设计的平台上提供一致和预期的结果这一事实。

我们不会详细检查每一个结果(四组将产生总共 64 个结果),而是查看一些亮点。 在我们的 4K 测试中,我们看到 JBOD 组以亚毫秒级读取延迟接近 3 万次 IOPS,而 RAID0 仅以 1.9 毫秒延迟达到 1.35 万次 IOPS。 对于 64K 顺序,我们看到读取速度高达 22.7GB/s,写入速度高达 7.8GB/s。 我们的 SQL 测试看到 2.5 万次 IOPS,2.1-90 的 10 万次 IOPS 和 1.75-80 的 20 万次 IOPS 均低于 1.7 毫秒的延迟。 甲骨文看到 1.47 万次 IOPS,2.1-90 时 10 万次 IOPS 和 1.76-80 时 20 万次 IOPS,所有延迟均在 2.18 毫秒或更短。 我们的 VDI 测试显示 FC Boot 为 1.4 万 IOPS,FC Initial Login 为 430K IOPS,VDI FC Monday Login 为 436K IOPS,LC Boot 为 821K IOPS,LC Initial Login 为 277K IOPS,LC Monday Login 为 279K IOPS。

最终,英特尔 VROC 为 EchoStreams 等系统供应商提供的是一种使用 NVMe SSD 提供 RAID 的简化方法。 结果是 EchoStreams 可以以更低的复杂性和成本提供出色的吞吐量和延迟。 此外,得益于 Intel VMD 的附加功能,EchoStreams 客户通过 NVMe SSD 热插拔、NVMe 驱动器灯支持和具有预启动配置的可启动 RAID 等功能提高了系统可维护性。 如前所述,用例多种多样,但显然 CDN 和其他人可以通过广泛可用的最快存储和网络接口从企业级 RAID 中获益,这具有巨大的潜力。

EchoStreams FlacheSAN1N10U-D5 产品页面

讨论这篇评论

注册 StorageReview 时事通讯



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3