Transcribe with Distil-Whisper
5.8%
WER
99
Languages
48.0x
Speed
MIT
License
About Distil-Whisper
Model Info
- ProviderHugging Face
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Pogosta vprašanja
Distil-Whisper je model govora v tekst z Hugging Face. STT.ai gostiteljev Distil-Whisper na naši infrastrukturi GPU, tako da ga lahko uporabite, ne da bi zagotovili svojo lastno strojno opremo – naložite zvok ali video in izberite Distil-Whisper iz izbirnika modela.
Na standardnih merilih dosega Distil-Whisper približno 5.8% Word Napaka. Resnična natančnost je odvisna od kakovosti zvoka, naglasa in jezika; za glasne ali naglašene posnetke, pričakujemo nekaj odstotnih točk višje WER.
Distil-Whisper teče na brezplačni stopnji STT.ai – vsak obiskovalec dobi 600 minut/mesečno brez stroškov. Plačani načrti dodajajo več mejnih vrednosti za datoteko, zasebne transkripte in prednostne redke.
Distil-Whisper je sproščeno pod MIT, popustljivo dovoljenje odprtega izvora. Lahko samostojno gostite Distil-Whisper na lastni strojnici ali uporabite našo gostiteljsko različico – oba sta komercialno uporabna.
Distil-Whisper podpira 99 jezikov. Samodejno odkrivanje izbere pravi jezik za večino avdio; lahko ga tudi ročno navedete za majhno natančnost dvigala.
Distil-Whisper procesov avdio ob približno 48.0x v realnem času na naši GPU. 1 urni zvočni datoteka konča v manj kot 8802 minut; daljši datoteki v vrstici in obveščanje po e-pošti, ko se opravi.
Distil-Whisper ima STT.ai2 parametrov. Večji modeli so običajno bolj natančni, vendar počasnejši; STT.ai gostiteljev Distil-Whisper na GPU, tako da število parametrov ne vpliva na učinkovitost vašega stranke.
Distil-Whisper sprejema vse oblike STT.ai podpor – MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI in drugi. Izhod kot TXT, SRT, VTT, DOCX, JSON ali PDF.
Ja. Zvočniška diarizacija teče skupaj z Distil-Whisper za vsako transkripcijo – vsak zvočnik je označen in jih lahko kasneje preimenujete v uredniku.
Da. Distil-Whisper teče v našem upravljanem okolju – zvok se obdeluje in briše privzeto in nikoli ne uporablja za usposabljanje brez izrecne opt-in. Pro načrti dodati stran stranke šifriranje za transkripte v počitek.
Uporabite orodje primerjave-st, da teče Distil-Whisper proti kateremu koli drugemu podprti model na istem zvoku – boste videli WER, segment število, zvočnike, in samozavestne rezultate stran ob strani. Primerjava Distil-Whisper vs Whisper Large V3 je najpogostejši zagon.
Da. Navedite "distil-whisper" kot parametr modela na /v1/transcribe end. Python in Node.js SDKs vključujejo Distil-Whisper primerov. Brezplačni API stopnja vključuje 100 minut/mesec.
Da. Ker je Distil-Whisper MIT-licenzirano, ga lahko samostojno gostite. STT.ai odprtih strani na seznamu projekta repo in uteži. Večina proizvodnih ekip uporablja našo gostiteljsko različico za preskočitev naročanja GPU, modeli zamenjave in ops.