
大众AI的顶级嘉会GTC于3月17日到3月21日在好意思国硅谷汜博举行。在GTC大会期间,华瑞指数云ExponTechCTO曹羽中受邀投入了专注于AIStorage的期间研讨会并发饰演讲。在演讲中,曹羽中先容了ExponTech与配联合伴ScaleFlux,AIC基于英伟达的BlueField3DPU以及英伟达最新发布的Spectrum-X相聚打造的新式AIStorage有策动,展示了该有策动的本体测试数据,并与配联合伴,AIStorage行业大家以及一些大型客户进行了潜入商议。与会的大家均示意该有策动的实测性能数据以及详尽上风推崇远超预期,具备很高的买卖价值,veryimpressive!
新式AI存储有策动秉承的软硬件有策动:
硬件:
F2026 AI工作器,是一台2U闪存JBOF,配备2个或4个NVIDIA BlueField-3数据处理单位(DPU)和24块高性能ScaleFlux CSD5000 NVMe SSD(CSD5000是ScaleFlux公司最新推出的一款内置硬件压缩与解压缩才调的高性能NVMe SSD介质);
NVIDIA Spectrum-X相聚交换机;
软件:
华瑞指数云ExponTech下一代散布式存储软件平台WADP (WiDE AI Data Platform);
(本有策动秉承的2U存储节点及ScaleFluxCSD5000 NVMe SSD)
基于此有策动的AI历练和推理环境的实测部署架构如下图:
1台2U AIC JBOF动作存储工作器, 配备4块NVIDIA BlueField3 DPU, 提供1600Gbps相聚带宽,24块ScaleFlux CSD5000 NVMe SSD,ExponTech WADP存储软件的后端运转于BlueField3 DPU内;
1 台法式2U工作器动作盘算推算工作器,配备4块NVIDIA BlueField3 DPU,提供800Gbps相聚带宽,在DPU里面运转ExponTech WADP存储软件的存储网关和公约;
盘算推算工作器上不错设立GPU,用于历练或推理,存储软件和相聚流量运转于DPU内,存储IO不会破钞盘算推算工作器的CPU和内存资源,盘算推算工作器不错领有更充沛的资源用于盘算推算处理;
测试环境颠倒聘用了4台NVIDIA Spectrum-X交换机组成两层相聚,主若是为了模拟与考证在大规模组网的情况下,RoCE相聚是否依然不错很好的处理拥塞,存储软件不错依然保合手解析的存储性能和低时延;
存储工作器(JBOF)和盘算推算工作器均不错按需安详彭胀,按需加入更多的存储工作器(JBOF)或者盘算推算工作器,组成大规模的,存算折柳的,按需彭胀的AI历练和推理集群。
基础存储性能考证:
基于上一节所述的实测部署环境,进行了存储系统的基础性能考证,其考证门径是从盘算推算节点上运转FIO,测试存储系统的基础性能倡导。
单个盘算推算节点不错达到近90GB/s的存储带宽,接近盘算推算节点网卡的物理带宽上限;
单个盘算推算节点不错达到310万IOPS,当设立更多的盘算推算节点时,不错同步赢得更多的IOPS。沟通到通盘存储系统的后端以及公约端齐是跑在DPU内,DPU内的CPU处感性能远远不如工作器设立的CPU,单个盘算推算节点+单个存储节点即达到310万IOPS还是充分展现了本有策动十分惊东谈主的IO处理后果;
存储系统的IOPS与存储节点上部署的数据处理单位(DPU)数目呈线性比例彭胀,系统的IOPS随DPU部署数目线性彭胀,标明其具备极佳的横向彭胀才调。本有策动秉承的存储节点最多不错设立8张DPU(刻下测试环境设立4张),还不错已毕IOPS性能翻倍以及相聚带宽翻倍;
存储系统在使用小IO size时,并发大压力时延低至266us, 在使用大IO size时,打满盘算推算节点的相聚物理带宽,时延还能永久保合手在1毫秒以下。
MLPerfStorage v1.0测试末端:
MLPerf™是影响力最广的海外AI性能基准评测,MLPerf™Storage是针对AIStorage的基准性能测试,不错较为全面的评估测试AI应用智商的存储需求。MLPerf™Storage基准测试通过运转一个散布式历练测试智商,模拟GPU盘算推算经过,在此经过中着实的试验AI工作器对存储系统的读写探访,以此来测试存储系统大致支合手的最大GPU数目和带宽推崇。
MLPerfStoragev1.0于2024年8月推出,国表里一共有十三家从事高性能存储研发的厂家参与了测试并提交认真测试末端,其中包括DDN(Lustre),华为,WekaIO,Hammerspace等著名的散布式文献系统厂家。
本次咱们聘用了ResNet50模子(主要用于图像分类和图像识别场景),在上述1存储节点(JBOF)+1盘算推算节点的测试环境上进行了MLPerfStorage v1.0基准测试,测试的末端如下:
测试末端标明:
ExponTech的新式AI存储有策动具备大众率先的性能,单客户端大致支合手的GPU卡的数目越过了统统参与了MLPerf Storage v1.0认真测试的厂商,位居大众第一;单客户端大致已毕的存储带宽达到近30GB/s, 位居大众第二;
本次测试环境只须一个客户端节点(盘算推算节点),CPU和内存设立较低,在运转MLPerf Storage v1.0的测试中还是达到了客户端节点的盘算推算才调的瓶颈,然则还远远莫得达到存储节点的存储才调的瓶颈。如果换用处理才调更强的盘算推算节点来作念测试,不错测试出更高的性能数据,即支合手更多的GPU卡,已毕更高的存储带宽。
追念
基于本次在着实的环境上的全面测试,追念一下ExponTech与配联合伴ScaleFlux,AIC基于英伟达的BlueField3DPU以及英伟达最新发布的Spectrum-X相聚打造的新式AIStorage有策动的要津特色和上风:
寰球顶级性能,SPC-1 评测零散统统高端全闪存储阵列,突破寰球记录,MLPerf Storage v1.0测试数据大幅度零散WekaIO, DDN等有名并行文献系统;
寰球顶级容量密度,刻下每2U Storage Node可已毕越过1.6PB存储裸容量,来岁可彭胀至每2U越过6.6PB,最大化数据中心空间的AI数据价值;
设立的ScaleFlux CSD5000 NVMe SSD具有盘内透明压缩解压缩才调,大致在不破钞额外系统资源,不影响性能的情况下已毕有储裸容量的数倍放大,存储容量后果赢得惊东谈主的进步;
并吞平台上同期支合手高性能散布式块存储和文献存储等多种公约,除了支合手AI的历练和推理场景,还不错隐秘数据相聚,数据准备,RAG等AI Pipeline全场景,不必为AI Pipeline设立不同的存储有策动以及反复进行数据拷贝出动,不错已毕AI算力和存力的全齐存算折柳和安详彭胀,具备更好的可解决性和后果;
浩瀚的并行彭胀性,存储节点及盘算推算节点均不错安详的水平彭胀,同期已毕有储性能和容量的等比例彭胀;
可靠性高,可留心性高,存储节点秉承比拟法式工作器更为精简的JBOF,硬件故障率更低,同期JBOF里面秉承冗余的硬件假想来保险可靠性,进步可留心性;
支合手基于RoCE的超大规模组网,秉承RoCE动态路由和细粒度的负载平衡已毕更好的拥塞遣散,基于法式以太网在大规模RDMA组网中已毕高效带宽, 低抖动和超低时延;
优化的总体领有老本(TCO),高密度的存储节点+透明盘内压缩+新式软件界说存储软件的组合简化了硬件老本,大幅度进步了存储空间讹诈后果和读写性能,简化了解决,AI客户将因此大幅度优化其AI Storage的总体领有老本(TCO);
基于此有策动的KV Cache大规模合手久化有策动也行将推出欧洲杯体育,已毕AI推理集群内的K,V向量的全局分享,大致以低老本高性能的大规模存储才调替代AI推理经过中K,V向量的无数类似运算,已毕AI推理算力老本的大幅镌汰。
声明:新浪网独家稿件,未经授权禁锢转载。 -->