Prompt Injection: Large Language Model Security Risk

Organisations need to identify strategies to counteract this harmful cyberattack as generative AI applications grow more and more integrated into enterprise IT platforms

[{"selector":"#anim-29a0286b-7752-4530-925b-728f36fb2ed5","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-6a231db1-2b8d-4dc8-8ca9-c0e36a7d035d [data-leaf-element=\"true\"]","keyframes":{"transform":["translate(20.05714291347533%, 0%) scale(1.5)","translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}]

Hackers can use a technique known as “prompt injections” to trick an LLM application into accepting harmful text that is actually legitimate user input

[{"selector":"#anim-49f5ab0c-13d3-4587-b69a-a7ce5acefced","keyframes":{"transform":["translate3d(116.72026%, 0px, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":1000,"easing":"cubic-bezier(.2, 0, .8, 1)","fill":"both"}] [{"selector":"#anim-9b672bdd-9ffa-43d1-918f-309f8a97364a","keyframes":{"transform":["rotateZ(180deg)","rotateZ(0deg)"]},"delay":0,"duration":1000,"easing":"cubic-bezier(.2, 0, .5, 1)","fill":"forwards"}] [{"selector":"#anim-2b066807-18ce-4a1c-8b81-5f565ed0d52a [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(-10.624999904429616%, 0, 0)","translate3d(0%, 0, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}]

The prompt’s wording, “when it comes to remote work and remote jobs,” drew the bot’s attention because it was designed to react to tweets regarding remote labour

[{"selector":"#anim-d13ede40-7b7d-44ad-bdbd-d32045a1b164","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-8ff8921b-1a79-45fa-a8e9-30bc7f26a1a9","keyframes":{"transform":["translate3d(0px, -125.42782%, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-fdaf2c3c-824e-4dd8-9071-dd8d8237044b [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(-14.492187404002948%, 0, 0)","translate3d(0%, 0, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}]

LLM apps can stay ahead of hackers with regular updates and patching, just like traditional software. In contrast to GPT-3.5, GPT-4 is less sensitive to quick injections

[{"selector":"#anim-6ad19cea-e15e-4800-b413-0acb65924d52","keyframes":{"transform":["translate3d(-120.19868%, 0px, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":1000,"easing":"cubic-bezier(.2, 0, .8, 1)","fill":"both"}] [{"selector":"#anim-e6fb975e-fd9d-4eb7-b282-0197a48eb924","keyframes":{"transform":["rotateZ(-180deg)","rotateZ(0deg)"]},"delay":0,"duration":1000,"easing":"cubic-bezier(.2, 0, .5, 1)","fill":"forwards"}] [{"selector":"#anim-25c4cc48-6557-43a6-b10e-32de07c2732d [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(14.124999904429615%, 0, 0)","translate3d(0%, 0, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}]

Although it is challenging to parameterize inputs into an LLM, developers can at least do so for any data the LLM sends to plugins or APIs

[{"selector":"#anim-21dc43f6-8aba-4a81-b6a8-66ae9654b0bd","keyframes":{"opacity":[1,1]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-34cae5e0-9c33-4dac-842e-964b3912f9d4","keyframes":{"transform":["scale(3)","scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-0fce3a45-1c36-4043-9151-ee60157d27ee [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(-21.749441792862413%, 0, 0) translate(-25%, 0%) scale(1.5)","translate3d(0%, 0, 0) translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"fill":"forwards"}]

Comparing the system prompt with human input Prompt injections can fool LLMs by imitating the syntax or language of system prompts

[{"selector":"#anim-cc9d63bc-8b0f-4d5f-962d-11a4ad1b2572","keyframes":{"opacity":[0,1]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-f9fee321-0a9a-4ed2-8c3e-fca639ac75f0","keyframes":{"transform":["scale(0.3333333333333333)","scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-d7846ca5-e864-4866-9673-eb804c176582 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(35.302419265654365%, 0, 0)","translate3d(0%, 0, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}]

Hackers most frequently breach company networks by misusing legitimate user identities, according to the IBM X-Force Threat Intelligence Index

[{"selector":"#anim-3ae98b69-a5b0-4b42-8da0-8ad52e29ad79","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-8bd5405c-9ff6-47b3-a831-dfd27ecd9876","keyframes":{"transform":["translate3d(117.58958%, 0px, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-c0016b1b-7297-4efd-a949-1a8906f25985 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(-21.874999829338588%, 0, 0) translate(-25%, 0%) scale(1.5)","translate3d(0%, 0, 0) translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"fill":"forwards"}]

LLM applications carry certain risk despite their ability to improve and expedite work processes For more details govindhtech.com

[{"selector":"#anim-ebb88094-f38b-47ab-8ead-cebc02aabfc5","keyframes":{"transform":["rotate(-540deg) scale(0.1)","none"],"opacity":[0,1]},"delay":0,"duration":1000,"fill":"both","iterations":1}] [{"selector":"#anim-a9f0189e-6079-476d-b012-0116ca91900c [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(-34.249999904429615%, 0, 0)","translate3d(0%, 0, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}]