Trillium TPUs

Google Cloud is delighted to unveil Trillium, Google's sixth-generation TPU, the most powerful and energy-efficient yet, to push model limits and empower you

[{"selector":"#anim-f55e3db7-eaba-4b58-92db-c44d8ba04543 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(36.201171791269246%, 0, 0)","translate3d(0%, 0, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-bf6c2264-53f7-42b4-8685-c1941543c99f","keyframes":[{"offset":0,"transform":"translate3d(0, -151.84302%, 0)","easing":"cubic-bezier(.5, 0, 1, 1)"},{"offset":0.29,"transform":"translate3d(0, 0%, 0)","easing":"cubic-bezier(0, 0, .5, 1)"},{"offset":0.45,"transform":"translate3d(0, -42.698257224%, 0)","easing":"cubic-bezier(.5, 0, 1, 1)"},{"offset":0.61,"transform":"translate3d(0, 0%, 0)","easing":"cubic-bezier(0, 0, .5, 1)"},{"offset":0.71,"transform":"translate3d(0, -14.516192712%, 0)","easing":"cubic-bezier(.5, 0, 1, 1)"},{"offset":0.8,"transform":"translate3d(0, 0%, 0)","easing":"cubic-bezier(0, 0, .5, 1)"},{"offset":0.85,"transform":"translate3d(0, -5.451164418%, 0)","easing":"cubic-bezier(.5, 0, 1, 1)"},{"offset":0.92,"transform":"translate3d(0, 0%, 0)","easing":"cubic-bezier(0, 0, .5, 1)"},{"offset":0.96,"transform":"translate3d(0, -2.368751112%, 0)","easing":"cubic-bezier(.5, 0, 1, 1)"},{"offset":1,"transform":"translate3d(0, 0%, 0)","easing":"cubic-bezier(0, 0, .5, 1)"}],"delay":0,"duration":600,"fill":"both"}]

Comparing Trillium TPUs to TPU v5e, a remarkable 4.7X boost in peak computation performance per chip is achieved

[{"selector":"#anim-797cf013-fa7c-4f89-b499-7fecb01cfae9 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate(0%, 0%) scale(1.5)","translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-62dd98e8-f895-4a78-ba97-a86f13e5f039","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-6da0ebf0-3f0c-4fe1-8981-3c21cedb0f74","keyframes":{"transform":["translate3d(118.60466%, 0px, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}]

Google realised over ten years ago that a novel microprocessor was necessary for machine learning

[{"selector":"#anim-6f339ab7-4bd2-413f-9d57-b19c45d8173c [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(-33.99621202410176%, 0, 0)","translate3d(0%, 0, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-a2a8fe51-b57f-4dc4-a410-40d4914558b6","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-97ddacd4-2c45-44c1-9a71-edbcd777094c","keyframes":{"transform":["translate3d(0px, -218.41522%, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}]

Trillium may operate with larger models with more weights and larger key-value caches by doubling the HBM capacity and bandwidth

[{"selector":"#anim-f212e4db-f4aa-46ca-81f8-158470271ff2 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(32.08407462438295%, 0, 0)","translate3d(0%, 0, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-3b499f74-b061-4f6a-a76e-89fb0974294d","keyframes":{"opacity":[1,1]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-df093823-7245-45d2-890c-e95da57711f5","keyframes":{"transform":["scale(3)","scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}]

The next generation of AI models and agents will be powered by trillium TPUs, and they are excited to assist Google’s customers take use of these cutting-edge features

[{"selector":"#anim-2ef32292-07c9-4622-b381-74692e6ea5f0 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate(0%, 0%) scale(1.5)","translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-ef2ed1e3-841a-4320-8955-b4b5b7ea00fa","keyframes":{"transform":["translate3d(-118.27242%, 0px, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":1000,"easing":"cubic-bezier(.2, 0, .8, 1)","fill":"both"}] [{"selector":"#anim-309d8b8b-b20a-489e-8475-13eb7c05e1b9","keyframes":{"transform":["rotateZ(-180deg)","rotateZ(0deg)"]},"delay":0,"duration":1000,"easing":"cubic-bezier(.2, 0, .5, 1)","fill":"forwards"}]

Google Deep Mind can train and serve future Gemini models faster, better, and with less latency with Trillium TPUs' long-context, multimodal model training and serving

[{"selector":"#anim-8ed40498-2736-4136-8b8e-97a5ab05b78c [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(-36.201171791269246%, 0, 0)","translate3d(0%, 0, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-c5053392-281a-4278-9cc4-4209a1548563","keyframes":[{"offset":0,"transform":"translate3d(0, -147.11979%, 0)","easing":"cubic-bezier(.5, 0, 1, 1)"},{"offset":0.29,"transform":"translate3d(0, 0%, 0)","easing":"cubic-bezier(0, 0, .5, 1)"},{"offset":0.45,"transform":"translate3d(0, -41.370084948%, 0)","easing":"cubic-bezier(.5, 0, 1, 1)"},{"offset":0.61,"transform":"translate3d(0, 0%, 0)","easing":"cubic-bezier(0, 0, .5, 1)"},{"offset":0.71,"transform":"translate3d(0, -14.064651924%, 0)","easing":"cubic-bezier(.5, 0, 1, 1)"},{"offset":0.8,"transform":"translate3d(0, 0%, 0)","easing":"cubic-bezier(0, 0, .5, 1)"},{"offset":0.85,"transform":"translate3d(0, -5.281600461%, 0)","easing":"cubic-bezier(.5, 0, 1, 1)"},{"offset":0.92,"transform":"translate3d(0, 0%, 0)","easing":"cubic-bezier(0, 0, .5, 1)"},{"offset":0.96,"transform":"translate3d(0, -2.2950687239999996%, 0)","easing":"cubic-bezier(.5, 0, 1, 1)"},{"offset":1,"transform":"translate3d(0, 0%, 0)","easing":"cubic-bezier(0, 0, .5, 1)"}],"delay":0,"duration":600,"fill":"both"}]

AI Hypercomputer from Google Cloud, a revolutionary supercomputing architecture created especially for state-of-the-art AI applications, includes Trillium

[{"selector":"#anim-eb4395ac-491a-4a41-b646-31d0c1b7d9ce [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(-34.249999904429615%, 0, 0) translate(-25%, 0%) scale(1.5)","translate3d(0%, 0, 0) translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"fill":"forwards"}] [{"selector":"#anim-90263e59-bedc-44be-943c-a10493c50d26","keyframes":{"transform":["rotate(-540deg) scale(0.1)","none"],"opacity":[0,1]},"delay":0,"duration":1000,"fill":"both","iterations":1}]

The variable consumption models needed for AI/ML workloads are also provided by AI Hypercomputer

[{"selector":"#anim-757b7296-8bae-4856-9a45-812208997181 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(-32.08407462438295%, 0, 0)","translate3d(0%, 0, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-f4bba906-4d14-421d-9b31-5c80595c74e9","keyframes":{"transform":["scale(1)","scale(1.5)","scale(0.95)","scale(1)"],"offset":[0,0.33,0.66,1]},"delay":0,"duration":1450,"easing":"ease-in-out","fill":"both","iterations":1}]

Google Cloud Partner of the Year for AI, will offer Trillium to transform businesses with generative AI For More Details Govindhtech.com

[{"selector":"#anim-77cda0f0-6028-4cb5-8fe4-35b4907b2146 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(30.270522268341992%, 0, 0)","translate3d(0%, 0, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-de05d50f-2beb-44c8-b59e-a20ce017aa0b","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-e56b1640-102b-42d9-9d66-ef64ea6fab30","keyframes":{"transform":["translate3d(0px, 131.05809%, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}]