Marvel Edge Device: Generative AI Power Now!

How generative AI may be integrated into edge devices with constrained resources via pruning, quantization, and knowledge distillation

[{"selector":"#anim-9f095de5-0d83-428c-9a9d-5304d76eb323 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(12.514648210040342%, 0, 0)","translate3d(0%, 0, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-ba991a70-cf68-46bb-9f61-15082f51f4f2","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-ff520ce8-172d-4d72-b732-04c2de9ac595","keyframes":{"transform":["translate3d(0px, 166.63718%, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}]

Do you belong to that group? An worldwide AI craze was ignited in November 2022 when OpenAI debuted ChatGPT Furthermore, even though the majority of generative AI applications now operate on the cloud

[{"selector":"#anim-6f46321b-e834-489f-a45a-93053ba1b4f4 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(31.247955175199145%, 0, 0)","translate3d(0%, 0, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-ede960d5-7d38-4e2f-bc05-dd0d2ef981a7","keyframes":{"transform":["translate3d(130.93524%, 0px, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":1000,"easing":"cubic-bezier(.2, 0, .8, 1)","fill":"both"}] [{"selector":"#anim-42ad1f93-56ca-4889-bb6e-b94e91530949","keyframes":{"transform":["rotateZ(180deg)","rotateZ(0deg)"]},"delay":0,"duration":1000,"easing":"cubic-bezier(.2, 0, .5, 1)","fill":"forwards"}]

Since edge devices have substantial on-device AI processing capabilities, such as smartphones, laptops, and extended reality (XR) headsets, moving some or all of the AI burden to these devices is one of the most promising

[{"selector":"#anim-edadac7f-3f41-471b-919a-404dde5a8860 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(34.179687404002955%, 0, 0)","translate3d(0%, 0, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-38e75f11-27d0-488e-ae31-2fbd0d6a1f0a","keyframes":{"opacity":[1,1]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-8b2e7e45-5f7e-4206-b4d3-469f4ee63740","keyframes":{"transform":["scale(3)","scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}]

They showcased her text-to-image generative AI model, Stable Diffusion, at Mobile World Congress earlier this year using a Snapdragon 8 Gen 2 smartphone

[{"selector":"#anim-57858d08-787f-4f75-8c8e-ac20502e7b09 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(29.756042849407542%, 0, 0)","translate3d(0%, 0, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-8668aa71-0107-40b3-878c-d8da58b2d97b","keyframes":{"opacity":[0,1]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-8b9a9b6f-7172-4896-8059-a18bf5c3fcd5","keyframes":{"transform":["scale(0.3333333333333333)","scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}]

AI recently declared that to want to provide large language models (LLMs) on Snapdragon platforms in 2024, based on Meta’s Llama

[{"selector":"#anim-864e1f7d-7020-4bf3-aa26-d540c2cdf741 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(25.43082894875513%, 0, 0)","translate3d(0%, 0, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-1c36485b-9e0f-46f6-b91c-eea3bb49e7e1","keyframes":{"transform":["translate3d(-117.79935%, 0px, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-7e6b0471-65f1-49e6-97ea-bb50fab00b7b","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-b507b6a4-964c-48fd-9ed3-76db0f30e51d","keyframes":{"transform":["scale(0.15)","scale(1)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"forwards"}]

Artificial intelligence (AI) models used on edge devices or even in the cloud compromise accuracy for computational efficiency, while neural network models are typically taught in a data center with excellent accuracy

[{"selector":"#anim-eae42b14-ebfb-485d-8c90-0722bbcfb509 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(29.489696789238607%, 0, 0)","translate3d(0%, 0, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-9b869f02-3ff4-4bb5-942f-fc40ccb2fd37","keyframes":{"opacity":[1,1]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-6b61884b-21e1-40ec-8006-2dc48cc85fe6","keyframes":{"transform":["scale(3)","scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}]

This reduces the bit-precision that the AI model uses for the neural network’s weight and activation values The model size is halved by quantizing from 32 to 8 bits

[{"selector":"#anim-d84fb735-e816-40a5-8c4c-515d0765f849 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(34.179687404002955%, 0, 0)","translate3d(0%, 0, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-061b2dac-a385-4e01-8cc9-6443746f900f","keyframes":{"opacity":[1,1]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-695f7b9c-78e2-4406-8c06-88fb8f1310a7","keyframes":{"transform":["scale(3)","scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}]

Edge device optimization with generative AI is the way of the future For more details govindhtech.com

[{"selector":"#anim-27135775-ad98-4730-aac9-dc840ce66f7b [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(21.874999829338595%, 0, 0)","translate3d(0%, 0, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-7cf8838e-35a1-44e3-bf7c-7a4d7892f7ee","keyframes":{"transform":["translate3d(121.03448%, 0px, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-76c6f72f-abd0-4ed5-9e7b-4429106b599d","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-a801f995-8678-49e5-b337-f4963f2d4e4f","keyframes":{"transform":["scale(0.15)","scale(1)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"forwards"}]