Dasturlash

DjVu formatining tarixi va zamonaviy sun'iy intellekt bilan aloqasi

6-mart, 2026, 18:2614 ko'rish2 daqiqa o'qish
DjVu formatining tarixi va zamonaviy sun'iy intellekt bilan aloqasi

DjVu – matn, rasmlar va ilmiy maqolalarni skanerlashda PDF ga nisbatan ancha samarali siqish imkonini beruvchi fayl formati. 1990‑yillarda Yann LeCun, Léon Bottou va Yoshua Bengio kabi sun'iy intellekt (AI) sohasining asoschilaridan biri bo‘lgan mutaxassislar tomonidan yaratilgan. Ular DjVu ni yaratishda matn va tasvirlarni alohida ko‘rib, keraksiz ma'lumotlarni yo‘qotish orqali fayl hajmini sezilarli darajada kamaytirish g‘oyasini ilgari surdilar.

DjVu ning texnik afzalliklari

DjVu ikki asosiy komponentdan iborat: fon tasvirlari uchun IW44 (JPEG2000 ga o‘xshash) va matn uchun JB2 siqish algoritmi. IW44 to‘lqinli (wavelet) siqishni qo‘llaydi, bu esa faylning birinchi qismini yuklab olganimizda ham past rezolyutsiyali, ammo o‘qilishi mumkin bo‘lgan tasvirni ko‘rish imkonini beradi. JB2 esa har bir belgini (character) klasterlash orqali takroriy elementlarni bitta kodga birlashtiradi, natijada matnning hajmi juda kichik bo‘ladi.

  • Tez yuklash: DjVu fayllari internet tarmog‘ida sekin bo‘lgan aloqalar uchun ham qulay, chunki ularning hajmi PDF ga qaraganda 4‑5 baravar kichikroq.
  • Matn va grafikani ajratish: Matnni OCR (optik belgilarni tanish) bilan ajratib, alohida siqish, bu esa qidiruv tizimlari uchun ham foydali.
  • Arifmetik kodlash (ZP‑coder): ma'lumotlarni yanada siqish uchun ehtimollik jadvallaridan foydalanadi.

PDF bilan solishtirganda DjVu ning kamchiliklari

DjVu ning asosiy muammosi – keng tarqalgan dasturiy ta'minot va qurilmalarda qo‘llab‑quvvatlanmasligi. Adobe Reader har doim PDF formatini standart o‘quvchi sifatida taklif qilgan, DjVu esa maxsus dastur yoki plagin talab qiladi. Bu sababli ko‘plab foydalanuvchilar PDF ni afzal ko‘rishadi, garchi u katta hajmda bo‘lsa ham.

DjVu va sun'iy intellekt

DjVu yaratuvchilari sun'iy intellektning asoschilaridan bo‘lishi formatning ilmiy ahamiyatini yanada oshiradi. Bugungi kunda AI modellarini o‘qitishda katta hajmdagi matnli ma'lumotlar zarur. DjVu siqilgan skanerlangan kitoblarni tezkor tarzda tahlil qilish, OCR orqali matnni ajratish va katta korpuslar yaratish uchun qulay platforma bo‘lishi mumkin. Bundan tashqari, arifmetik kodlash algoritmlari AI ning generativ modellarida ma'lumotlarni siqish va qayta tiklashda ilhom manbai bo‘lishi mumkin.

Amaliy foydalanish misollari

Ko‘plab ilmiy kutubxonalar va arxivlar DjVu formatidan foydalangan. Masalan, Internet Archive ba'zi eski skanerlangan kitoblarni DjVu sifatida saqlaydi. E‑kitob o‘quvchilar, xususan Kobo va Kindle kabi qurilmalarda DjVu fayllarini o‘qish uchun maxsus plaginlar yoki Koreader kabi ochiq kodli dasturlar o‘rnatiladi.

DjVu ning kelajagi esa, asosan, ochiq kodli hamjamiyat va AI texnologiyalarining integratsiyasi bilan bog‘liq. Agar PDF formatiga o‘xshash universal o‘quvchi yaratilsa, DjVu yana keng tarqalgan bo‘lishi mumkin.

Manba: Hacker News
#DjVu #fayl format #siqish #sun'iy intellekt #PDF
Telegram da muhokama qilish