Micron SSD: Dell PowerEdge Server Gen5 NVMe SSDs

Micron presented its industry-leading research on AI training model offload to NVMe, collaborating with teams at Dell and NVIDIA

[{"selector":"#anim-e1244060-3b05-4452-9761-8e60ffe2e622 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(21.874999829338595%, 0, 0)","translate3d(0%, 0, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-12b6d0ef-6eba-4012-9656-1c6a8b8eb9e4","keyframes":{"transform":["rotate(-540deg) scale(0.1)","none"],"opacity":[0,1]},"delay":0,"duration":1000,"fill":"both","iterations":1}]

The standard procedure for training huge models whose sizes are increasing quickly is to use as much HBM as possible on the GPU

[{"selector":"#anim-6c48aaf7-66a5-40d3-b2b0-8638ad3bdaf3 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(-33.12499989760315%, 0, 0)","translate3d(0%, 0, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-6e259cb1-c67c-4dca-a679-28d95a2869e6","keyframes":{"transform":["translate3d(-118.66666%, 0px, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-34c38e47-2785-40a7-80a5-e9351d3c40cb","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-1e1da081-04ea-4e75-ae31-2f886694f11f","keyframes":{"transform":["scale(0.15)","scale(1)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"forwards"}]

The cost of parallelizing training over numerous servers is high since data must travel over system and network links, which can quickly become bottlenecks

[{"selector":"#anim-ddb56d08-c53e-40c0-887d-eeac0115a362 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(-34.44743368046207%, 0, 0) translate(-25%, 0%) scale(1.5)","translate3d(0%, 0, 0) translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"fill":"forwards"}] [{"selector":"#anim-3b204425-d864-449e-bf81-e69836f6ee21","keyframes":[{"offset":0,"transform":"translate3d(0, -147.11979%, 0)","easing":"cubic-bezier(.5, 0, 1, 1)"},{"offset":0.29,"transform":"translate3d(0, 0%, 0)","easing":"cubic-bezier(0, 0, .5, 1)"},{"offset":0.45,"transform":"translate3d(0, -41.370084948%, 0)","easing":"cubic-bezier(.5, 0, 1, 1)"},{"offset":0.61,"transform":"translate3d(0, 0%, 0)","easing":"cubic-bezier(0, 0, .5, 1)"},{"offset":0.71,"transform":"translate3d(0, -14.064651924%, 0)","easing":"cubic-bezier(.5, 0, 1, 1)"},{"offset":0.8,"transform":"translate3d(0, 0%, 0)","easing":"cubic-bezier(0, 0, .5, 1)"},{"offset":0.85,"transform":"translate3d(0, -5.281600461%, 0)","easing":"cubic-bezier(.5, 0, 1, 1)"},{"offset":0.92,"transform":"translate3d(0, 0%, 0)","easing":"cubic-bezier(0, 0, .5, 1)"},{"offset":0.96,"transform":"translate3d(0, -2.2950687239999996%, 0)","easing":"cubic-bezier(.5, 0, 1, 1)"},{"offset":1,"transform":"translate3d(0, 0%, 0)","easing":"cubic-bezier(0, 0, .5, 1)"}],"delay":0,"duration":600,"fill":"both"}]

It transfers the data and control routes to the GPU by replacing and streamlining the Gen5 NVMe SSD driver

[{"selector":"#anim-ab8b2727-4dda-4e1d-bfd5-2c416309ba1b [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(-33.12499989760315%, 0, 0) translate(-25%, 0%) scale(1.5)","translate3d(0%, 0, 0) translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"fill":"forwards"}] [{"selector":"#anim-b5f824ab-1a73-4db4-89dc-a7d3b5997155","keyframes":{"transform":["rotate(-540deg) scale(0.1)","none"],"opacity":[0,1]},"delay":0,"duration":1000,"fill":"both","iterations":1}]

The benchmark’s feature aggregation component, which depends on storage performance, shows that performance improvement

[{"selector":"#anim-9f1589aa-3e45-40d4-99e4-76c5ad468e85 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate(0%, 0%) scale(1.5)","translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-decd19ce-e900-44c7-8615-d317da0089b3","keyframes":{"transform":["rotate(-540deg) scale(0.1)","none"],"opacity":[0,1]},"delay":0,"duration":1000,"fill":"both","iterations":1}]

Micron aimed to demonstrate at GTC how successfully their future Gen5 NVMe SSD performed AI model offload

[{"selector":"#anim-194aeb5f-b96c-43b6-b5b9-a8e44084133a [data-leaf-element=\"true\"]","keyframes":{"transform":["translate(0%, 0%) scale(1.5)","translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-12827ddb-7ab9-4a6f-b765-79270a8250a6","keyframes":{"transform":["rotate(-540deg) scale(0.1)","none"],"opacity":[0,1]},"delay":0,"duration":1000,"fill":"both","iterations":1}]

Its execution duration accounts for 80% of the whole runtime, and it improves by twice between Gen4 and Gen5 NVMe SSD

[{"selector":"#anim-de5df10d-7fe5-40a1-b703-1a6af7ae5906 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(33.12499989760315%, 0, 0)","translate3d(0%, 0, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-a265f63d-90a6-4f04-8ecf-76395899a87d","keyframes":{"transform":["translate3d(-115.2381%, 0px, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-0240461a-1c64-4cdf-9f5b-3e86cb49a1a0","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-16d431e8-bc7d-4d61-9c81-4af9aaee5e35","keyframes":{"transform":["scale(0.15)","scale(1)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"forwards"}]

The Data Centre Workload Engineering team at Micron measured the Gen5 NVMe SSD performance for more details govindhtech.com

[{"selector":"#anim-5a046bd6-7f7c-4e90-be2b-20b36be70dca [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(-21.874999829338588%, 0, 0) translate(-25%, 0%) scale(1.5)","translate3d(0%, 0, 0) translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"fill":"forwards"}] [{"selector":"#anim-e28d57b4-c39b-45f4-8f2a-69da9668c2e5","keyframes":[{"offset":0,"transform":"translate3d(0, -147.11979%, 0)","easing":"cubic-bezier(.5, 0, 1, 1)"},{"offset":0.29,"transform":"translate3d(0, 0%, 0)","easing":"cubic-bezier(0, 0, .5, 1)"},{"offset":0.45,"transform":"translate3d(0, -41.370084948%, 0)","easing":"cubic-bezier(.5, 0, 1, 1)"},{"offset":0.61,"transform":"translate3d(0, 0%, 0)","easing":"cubic-bezier(0, 0, .5, 1)"},{"offset":0.71,"transform":"translate3d(0, -14.064651924%, 0)","easing":"cubic-bezier(.5, 0, 1, 1)"},{"offset":0.8,"transform":"translate3d(0, 0%, 0)","easing":"cubic-bezier(0, 0, .5, 1)"},{"offset":0.85,"transform":"translate3d(0, -5.281600461%, 0)","easing":"cubic-bezier(.5, 0, 1, 1)"},{"offset":0.92,"transform":"translate3d(0, 0%, 0)","easing":"cubic-bezier(0, 0, .5, 1)"},{"offset":0.96,"transform":"translate3d(0, -2.2950687239999996%, 0)","easing":"cubic-bezier(.5, 0, 1, 1)"},{"offset":1,"transform":"translate3d(0, 0%, 0)","easing":"cubic-bezier(0, 0, .5, 1)"}],"delay":0,"duration":600,"fill":"both"}]