Transcribe with Distil-Whisper
5.8%
WER
99
Languages
48.0x
Speed
MIT
License
About Distil-Whisper
Model Info
- ProviderHugging Face
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Gynançly Soraglar
Distil-Whisper Hugging Face tarapyndan bir sözden metin modeldir. STT.ai Distil-Whisper-i biziň GPU-myzyň infratrukturasynda kabul edýär, şonuň üçin siz ony öz haýalyňyzy bermän ulanyp bilersiňiz — audio ýa-da video ýükläp we Distil-Whisper-i modlu saýlajydan saýlaň.
Standart benchmarks'da, Distil-Whisper 5.8% söz hata derejesine ýetýär. Hakykatda dogrylyk ses hili, aksent we dilde bagly; gürleşikli ýa aksentli ýazgylar üçin, birnäçe göterim WER'den ýokary garaş.
Distil-Whisper STT.ai's free tier üstünde işleýär — her bir myhman 600 minut/aýda mugt alýar. Ödenilen planlar faýl üçin has uzak çäklendirmeleri, şahsy transkripsiýalary we öňe sürülen nobatlary goşýar.
Distil-Whisper MIT astynda çykaryldy, bir ygtybarly açyk çeşme lisenziýasy. Siz Distil-Whisper-i öz hasabyňyzda öz-özüňize kabul edip bilersiňiz ýa-da biziň kabul edilen wersiýamyzy ulanyp bilersiňiz — ikisi hem söwda taýdan ulanylyp bilner.
Distil-Whisper 99 dilleri goldaýar. Otomatik tapmak köp ses üçin dogry dili saýlar; siz ony el bilen hem bellip bilersiňiz kiçiçe dogrylyk üçin.
Distil-Whisper audiony 48.0x real-time bilen işlemek üçin GPU'larymyzy ulanýar. 1 sagatlyk audio faýl 1 minutyň içinde tamamlanýar; uzak faýllar nobatda durýar we tamamlananda e-poçta bilen habar berler.
Distil-Whisper 756M parametrleri bar. Büyük modeller has dogry emma yavaş; STT.ai GPU'da Distil-Whisper'i kabul edýär şuňa görä parametrleriň sany siziň kliýent tarap işleýşinize täsir etmez.
Distil-Whisper STT.ai goldaýan her hili formaty kabul edýär — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, we beýlekiler. Çykyş TXT, SRT, VTT, DOCX, JSON, ýa-da PDF.
Eý. Sözleýji diaryzasiýasy her bir transkripsiýa üçin Distil-Whisper bilen bir hatarda işleýär - her bir sözleýji etiketlenýär we siz olary soňra redaktorda täzeden atlandyryp bilersiňiz.
Eý. Distil-Whisper biziň dolandyrylan gurşawymyzda işleýär — ses işlemek we pozmak öň bellenen we hiç wagt belli bir opt-insiz tälim üçin ulanylmaýar. Pro planlar ýatda duran transkripsiýalar üçin müşderi tarapy şifreleme goşýar.
Distil-Whisper-i aňşy sesde her haýsy goldawa eýe model bilen deňeşdirmek üçin compare-stt esbaby ullan — siz WER, segment sanaw, sözleýji etiketleri we ynamlylyk skorlaryny birikdiren görersiňiz. Distil-Whisper vs Whisper Large V3 deňeşdirmesi iň köp işlenen biridir.
Eý. "distil-whisper" parametrini /v1/transcribe ahyrynda model parametri hökmünde belle. Python we Node.js SDKs Distil-Whisper mysallary içer. Beýik API derejesi 100 minut/aýda içer.
Eý. Distil-Whisper MIT-licensiýaly bolansoň, siz ony öz-özüňize kabul edip bilersiňiz. STT.ai's open-source page lists the project repo and weights. Most production teams use our hosted version to skip GPU procurement, model swaps, and ops.