Post-qidiruv davri: Google AI agentlari bilan kelajakni shakllantiradi
Google endi faqat qidiruv vositasi emas, balki foydalanuvchi bilmasdan ma'lumot olib keluvchi AI agentiga aylanmoqda – post-qidiruv davri boshlanmoqda.

Transformer arxitekturasi sun'iy intellekt modellari, ayniqsa katta til modellari (LLM) uchun asosiy platforma hisoblanadi. Biroq, ushbu modellarning o'qitish jarayonida ko'p vaqt xotira‑cheklovli operatsiyalar, masalan, normalizatsiya, aktivatsiya funksiyalari, residual qo'shimchalar va turli qisqartirishlar (reduction) kabi amallarni bajarishda yo'qoladi. Bu amallar katta hajmdagi tensorlarni global xotiraga ko'chirishga majbur qiladi, natijada GPUning hisoblash quvvati to'liq foydalanilmaydi.
CODA – bu GPU kernel abstraksiyasi bo'lib, yuqoridagi xotira‑cheklovli amallarni "GEMM‑plus‑epilog" dasturlari sifatida ifodalaydi. Asosiy g'oya shundan iboratki, ko'p Transformer operatsiyalari algebrik tarzda qayta parametrizatsiya qilinib, GEMM (General Matrix Multiply) hisoblash jarayonida, natija chipda bo'lganda, darhol bajarilishi mumkin. Bu holda ma'lumotlar xotiraga yozilmasdan oldin kerakli o'zgartirishlar, masshtablash, qisqartirish va qo'shimcha hisoblashlar amalga oshiriladi.
Bu primitivlar birgalikda ishlatilganda, Transformer blokining diqqat (attention) bo'lmagan qismi – ya'ni forward va backward passdagi barcha qo'shimcha hisoblashlar – bitta samarali GEMM‑epilog kerneliga birlashtiriladi.
CODA yondashuvi bir nechta real Transformer ish yuklarida sinovdan o'tkazildi. Natijalar shuni ko'rsatdiki, insonlar va LLM‑lar tomonidan yozilgan CODA kernelari an'anaviy kernelar bilan solishtirganda sezilarli darajada tezroq ishlaydi. Bu esa GPUning hisoblash quvvatini maksimal darajada ishlatish, xotira o'tkazuvchanligini kamaytirish va umumiy o'qitish vaqtini qisqartirish imkonini beradi.
AI tadqiqotchilari va ishlab chiquvchilari doimo model o'lchamini oshirish, samaradorlikni yaxshilash va energiya sarfini kamaytirish bilan shug'ullanadi. CODA yondashuvi ushbu maqsadlarga erishishda muhim qadam bo'lib, Transformer arxitekturasini yanada samarali qilish, yangi avlod LLMlarni tezroq va arzonroq o'qitish imkonini beradi. Bundan tashqari, bu usul GPU ishlab chiqaruvchilari va dasturiy platformalar orasida yanada chuqur integratsiyani rag'batlantiradi.