Sun'iy intellekt

Mistral Voxtral Realtime 4B: Ovozli Matndan Matnga Modelining To'liq C Tafsiloti

15-fevral, 2026, 15:127 ko'rish1 daqiqa o'qish
Mistral Voxtral Realtime 4B: Ovozli Matndan Matnga Modelining To'liq C Tafsiloti

Mistral AI kompaniyasining Voxtral Realtime 4B modeli - bu ovozli matndan matnga konvertatsiya qilish uchun mo'ljallangan sun'iy intellekt modeli. Ushbu modelning to'liq C tafsili quyida keltirilgan.

Modelning Imkoniyatlari

  • Zero dependencies: Sof C implementatsiyasi, MPS uchun standalone ishlaydi.
  • Metal GPU acceleration: Apple Silicon Macs-da avtomatik ravishda GPU operatsiyalari bilan birlashtirilgan.
  • Streaming output: Tokenlar stdout-ga ular yaratilgan paytda yoziladi.
  • Streaming C API: Ovozni incrementally oziqlantirish va token stringlarni ular mavjud bo'lganda olish.

Ishlatish

Modelni ishlatish uchun quyidagi buyruqlarni bajarish kerak:

  • Modelni yuklab olish: ./download_model.sh
  • Audio faylni transkripsiya qilish: ./voxtral -d voxtral-model -i audio.wav
  • Live microphone transcription (macOS): ./voxtral -d voxtral-model --from-mic

API

Modelning API-si quyidagi funksiyalarni o'z ichiga oladi:

  • vox_stream_init: Ovozni stream qilish uchun kontekstdan yaratish.
  • vox_stream_feed: Ovozni incrementally oziqlantirish.
  • vox_stream_get: Token stringlarni ular mavjud bo'lganda olish.

Ushbu model Apache-2.0 litsenziyasi ostida tarqatiladi.

Manba: Hacker News
#Mistral AI #Voxtral Realtime 4B #ovozli matndan matnga #sun'iy intellekt
Telegram da muhokama qilish