To tune or not? SFT LLM data leverage guide

Data in the instructions, or system prompt, that are delivered to the model is the simplest way to enable interactions between a model and your data

[{"selector":"#anim-9364220f-a637-4946-9c2a-01a92e33e47b","keyframes":{"transform":["translate3d(-128.16902%, 0px, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":1000,"easing":"cubic-bezier(.2, 0, .8, 1)","fill":"both"}] [{"selector":"#anim-eda6c436-47eb-4875-8300-ca8b666a7806","keyframes":{"transform":["rotateZ(-180deg)","rotateZ(0deg)"]},"delay":0,"duration":1000,"easing":"cubic-bezier(.2, 0, .5, 1)","fill":"forwards"}] [{"selector":"#anim-30e31bf5-f976-4dbb-acd7-61dbb477f567 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(-32.4713907387075%, 0, 0) translate(-25%, 0%) scale(1.5)","translate3d(0%, 0, 0) translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"fill":"forwards"}]

Model outputs can be made sure to be firmly based on your data by using retrieval augmented generation, or RAG

[{"selector":"#anim-15cbc95a-d06b-4b08-9233-3500bb9dc2e3","keyframes":{"transform":["rotate(-540deg) scale(0.1)","none"],"opacity":[0,1]},"delay":0,"duration":1000,"fill":"both","iterations":1}] [{"selector":"#anim-adde7855-758c-4fde-9a81-dd697eb0e2a3 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(-35.937499914669296%, 0, 0) translate(-25%, 0%) scale(1.5)","translate3d(0%, 0, 0) translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"fill":"forwards"}]

You may wish to think about SFT LLM, also known as Parameter Efficient Fine Tuning (PEFT)

[{"selector":"#anim-6c22a9e3-25c1-4408-b80b-168453ec7787","keyframes":{"transform":["translate3d(-126.86568%, 0px, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":1000,"easing":"cubic-bezier(.2, 0, .8, 1)","fill":"both"}] [{"selector":"#anim-838b58dc-e1c4-4086-838f-f42588933b9f","keyframes":{"transform":["rotateZ(-180deg)","rotateZ(0deg)"]},"delay":0,"duration":1000,"easing":"cubic-bezier(.2, 0, .5, 1)","fill":"forwards"}] [{"selector":"#anim-5d83a735-1e17-485c-9316-f2721f9a4567 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(-32.692307587285285%, 0, 0) translate(-25%, 0%) scale(1.5)","translate3d(0%, 0, 0) translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"fill":"forwards"}]

You must give the model input-output pairs to learn from in order to execute supervised fine tuning

[{"selector":"#anim-b3515770-5a84-48cc-9b37-7683d8e06ba4","keyframes":{"transform":["translate3d(-125.08591%, 0px, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":1000,"easing":"cubic-bezier(.2, 0, .8, 1)","fill":"both"}] [{"selector":"#anim-e45d8d76-d7d9-4101-b9c4-565bd6c1a86d","keyframes":{"transform":["rotateZ(-180deg)","rotateZ(0deg)"]},"delay":0,"duration":1000,"easing":"cubic-bezier(.2, 0, .5, 1)","fill":"forwards"}] [{"selector":"#anim-74c03361-0756-422d-bbe5-958d4b4f5ad5 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(-21.874999829338588%, 0, 0) translate(-25%, 0%) scale(1.5)","translate3d(0%, 0, 0) translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"fill":"forwards"}]

A method called Reinforcement Learning from Human Feedback, or RLHF, builds a model that is strengthened by human preferences and tailored to your particular requirements

[{"selector":"#anim-2b9b6455-e36c-4795-bf64-b72a3ae69d93","keyframes":{"transform":["translate3d(-119.62025%, 0px, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":1000,"easing":"cubic-bezier(.2, 0, .8, 1)","fill":"both"}] [{"selector":"#anim-73006dba-0f6e-4dcf-9749-4421ab1b12a8","keyframes":{"transform":["rotateZ(-180deg)","rotateZ(0deg)"]},"delay":0,"duration":1000,"easing":"cubic-bezier(.2, 0, .5, 1)","fill":"forwards"}] [{"selector":"#anim-d1477d6a-4a2a-4f49-b123-dd7c3ff7548d [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(-33.901515053830174%, 0, 0) translate(-25%, 0%) scale(1.5)","translate3d(0%, 0, 0) translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"fill":"forwards"}]

Distillation is a brilliant technique that combines two objectives: reducing the size of the model so that it can handle data more quickly and making it more task-specific

[{"selector":"#anim-fea7f010-059a-45bd-aa5c-b9f4f1b2bef9","keyframes":{"opacity":[0,1]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-9c8e514a-e832-4ee8-9aac-520695efe128","keyframes":{"transform":["scale(0.3333333333333333)","scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-3a9c62f5-c874-4004-ab04-79719a835ebd [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(-34.249999904429615%, 0, 0) translate(-25%, 0%) scale(1.5)","translate3d(0%, 0, 0) translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"fill":"forwards"}]

Consider the scenario where you wish to use a smaller model to double-check every email you send in order to make them seem more formal

[{"selector":"#anim-dec821f6-d27e-4629-9208-d500dbe132bb","keyframes":{"transform":["translate3d(126.29630%, 0px, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-6e10c6b2-9cc5-43ad-9264-fd467cc9c98c","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-0f73a474-ac24-4dcb-853b-b95b335a63ae","keyframes":{"transform":["scale(0.15)","scale(1)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"forwards"}] [{"selector":"#anim-29746cff-6247-467f-be53-e4a281aba295 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(-21.874999829338588%, 0, 0)","translate3d(0%, 0, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}]

Another advantage of RAG is that, depending on who is calling the model, you can manage who has access to what grounding data

[{"selector":"#anim-eb189dff-5c8c-45a3-8b6f-3d70acd6e083","keyframes":{"transform":["translate3d(-118.21191%, 0px, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-d7962b09-fec6-4d39-9c80-0eff7a03578a","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-6cf66a19-1fab-4822-8798-3464605d5429","keyframes":{"transform":["scale(0.15)","scale(1)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"forwards"}] [{"selector":"#anim-95cef250-0f05-4807-a89d-d9bac9b71db1 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(-34.249999904429615%, 0, 0) translate(-25%, 0%) scale(1.5)","translate3d(0%, 0, 0) translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"fill":"forwards"}]

Try the RAG implementation provided by Prompt Engineering and Vertex AI Agent Builder For more details Govindhtech.com

[{"selector":"#anim-81eaab51-b9c0-4659-8d14-0b87411acc48","keyframes":[{"offset":0,"transform":"translate3d(0, -147.11979%, 0)","easing":"cubic-bezier(.5, 0, 1, 1)"},{"offset":0.29,"transform":"translate3d(0, 0%, 0)","easing":"cubic-bezier(0, 0, .5, 1)"},{"offset":0.45,"transform":"translate3d(0, -41.370084948%, 0)","easing":"cubic-bezier(.5, 0, 1, 1)"},{"offset":0.61,"transform":"translate3d(0, 0%, 0)","easing":"cubic-bezier(0, 0, .5, 1)"},{"offset":0.71,"transform":"translate3d(0, -14.064651924%, 0)","easing":"cubic-bezier(.5, 0, 1, 1)"},{"offset":0.8,"transform":"translate3d(0, 0%, 0)","easing":"cubic-bezier(0, 0, .5, 1)"},{"offset":0.85,"transform":"translate3d(0, -5.281600461%, 0)","easing":"cubic-bezier(.5, 0, 1, 1)"},{"offset":0.92,"transform":"translate3d(0, 0%, 0)","easing":"cubic-bezier(0, 0, .5, 1)"},{"offset":0.96,"transform":"translate3d(0, -2.2950687239999996%, 0)","easing":"cubic-bezier(.5, 0, 1, 1)"},{"offset":1,"transform":"translate3d(0, 0%, 0)","easing":"cubic-bezier(0, 0, .5, 1)"}],"delay":0,"duration":600,"fill":"both"}] [{"selector":"#anim-5d2293ae-0914-4dda-9e15-264a285486b8 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(-33.901515053830174%, 0, 0)","translate3d(0%, 0, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}]