The AAAI 2024 vision transformer and Convolutional Neural Network

Model pruning is a major acceleration technique that aims to remove unnecessary weights intentionally while preserving accuracy

[{"selector":"#anim-7226b431-72aa-45c5-9ab2-2e1f1ac35fec [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(-37.531249924340116%, 0, 0)","translate3d(0%, 0, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-8fec8d74-3ad5-4c30-b025-e8a782f42c41","keyframes":[{"offset":0,"transform":"translate3d(0, -187.5921%, 0)","easing":"cubic-bezier(.5, 0, 1, 1)"},{"offset":0.29,"transform":"translate3d(0, 0%, 0)","easing":"cubic-bezier(0, 0, .5, 1)"},{"offset":0.45,"transform":"translate3d(0, -52.75089852%, 0)","easing":"cubic-bezier(.5, 0, 1, 1)"},{"offset":0.61,"transform":"translate3d(0, 0%, 0)","easing":"cubic-bezier(0, 0, .5, 1)"},{"offset":0.71,"transform":"translate3d(0, -17.93380476%, 0)","easing":"cubic-bezier(.5, 0, 1, 1)"},{"offset":0.8,"transform":"translate3d(0, 0%, 0)","easing":"cubic-bezier(0, 0, .5, 1)"},{"offset":0.85,"transform":"translate3d(0, -6.73455639%, 0)","easing":"cubic-bezier(.5, 0, 1, 1)"},{"offset":0.92,"transform":"translate3d(0, 0%, 0)","easing":"cubic-bezier(0, 0, .5, 1)"},{"offset":0.96,"transform":"translate3d(0, -2.9264367599999996%, 0)","easing":"cubic-bezier(.5, 0, 1, 1)"},{"offset":1,"transform":"translate3d(0, 0%, 0)","easing":"cubic-bezier(0, 0, .5, 1)"}],"delay":0,"duration":600,"fill":"both"}]

The process of fine-tuning a subnet by eliminating activation layers directly may jeopardies the integrity of baseline model weights

[{"selector":"#anim-da365f62-424e-4df6-a4e2-36331d7b183e [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(30.101562379257054%, 0, 0)","translate3d(0%, 0, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-2f88e231-6574-42de-85fc-775dbeac2e9c","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}]

In order to address these issues, they suggest a depth pruning methodology that can prune CNN and vision transformer models

[{"selector":"#anim-17a97567-7d34-42d4-a52c-1e1cfaefdcfd [data-leaf-element=\"true\"]","keyframes":{"transform":["translate(0%, 0%) scale(1.5)","translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-9d9e6947-660f-48dd-891a-30efdcd1d977","keyframes":{"transform":["scale(1)","scale(1.5)","scale(0.95)","scale(1)"],"offset":[0,0.33,0.66,1]},"delay":0,"duration":1450,"easing":"ease-in-out","fill":"both","iterations":1}]

AMD depth pruning approach proposes a novel block pruning strategy with reparameterization technique in an effort to reduce model depth

[{"selector":"#anim-053dedd4-6a59-4065-9f56-9524ecfbe3e4 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(-31.284090795523493%, 0, 0) translate(-25%, 0%) scale(1.5)","translate3d(0%, 0, 0) translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"fill":"forwards"}] [{"selector":"#anim-875c1dca-6dae-4541-987c-fdcb98c18143","keyframes":{"transform":["translate3d(-115.2381%, 0px, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":1000,"easing":"cubic-bezier(.2, 0, .8, 1)","fill":"both"}] [{"selector":"#anim-66fd3745-f5ae-4192-8429-75eb96060302","keyframes":{"transform":["rotateZ(-180deg)","rotateZ(0deg)"]},"delay":0,"duration":1000,"easing":"cubic-bezier(.2, 0, .5, 1)","fill":"forwards"}]

To speed up and conserve memory, each baseline block that has been pruned will progressively grow into a smaller merged block

[{"selector":"#anim-67a595f0-0d11-4b8d-9806-ef522e549f4b [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(-21.874999829338588%, 0, 0)","translate3d(0%, 0, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-7b200376-300d-46b0-aa62-cbf34b9b1b8a","keyframes":{"transform":["translate3d(-115.87301%, 0px, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":1000,"easing":"cubic-bezier(.2, 0, .8, 1)","fill":"both"}] [{"selector":"#anim-ff7c44fb-007b-46b2-b549-aa6062a91c9e","keyframes":{"transform":["rotateZ(-180deg)","rotateZ(0deg)"]},"delay":0,"duration":1000,"easing":"cubic-bezier(.2, 0, .5, 1)","fill":"forwards"}]

A unified and efficient depth pruning method for both Convolutional Neural Network and vision transformer models

[{"selector":"#anim-38aeb72d-f501-4a99-87de-4943bcc1bdbd","keyframes":{"transform":["translate3d(-115.2381%, 0px, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-62422d95-09b4-4f8d-8758-d1a2d9a0aee1","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-9e577acb-6cc8-47d6-b30c-52a4b8cadb4d","keyframes":{"transform":["scale(0.15)","scale(1)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"forwards"}] [{"selector":"#anim-1f2cc3b8-19a9-4c61-b868-3b053f4081b4 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(34.15624990386074%, 0, 0)","translate3d(0%, 0, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}]

AMD applied its approach to ConvNeXtV1, resulting in three pruned models that outperformed popular models with identical inference performance, as shown by P6, which represents pruning 6 blocks of the model

[{"selector":"#anim-1a1783d1-5876-4959-ac60-72e71fc50a0a [data-leaf-element=\"true\"]","keyframes":{"transform":["translate(0%, 0%) scale(1.5)","translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-ad177d97-14f3-4c1d-ae6d-da71523921e9","keyframes":{"transform":["translate3d(-115.87301%, 0px, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-450366b5-c03e-4cdc-b9c3-82e4e3fbf6a3","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-b1a599f7-ae6d-4e91-9e3a-23759d52e694","keyframes":{"transform":["scale(0.15)","scale(1)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"forwards"}]

ConvNeXtV1 depth pruning findings on ImageNet performance. A batch size of 128 AMD Instinct MI100 GPUs is used to test speedups For more details Govindhtech.com

[{"selector":"#anim-078ad1ef-6c76-427d-bcf4-75cf9832a1d5 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(-35.28540817684146%, 0, 0) translate(-25%, 0%) scale(1.5)","translate3d(0%, 0, 0) translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"fill":"forwards"}] [{"selector":"#anim-a396a3ca-5244-43b9-b129-058eb7db9a60","keyframes":{"opacity":[0,1]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-e72f2786-8339-4aa8-bf9a-d18fe7f8d5ce","keyframes":{"transform":["scale(0.3333333333333333)","scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}]