Transcribe with Distil-Whisper
5.8%
WER
99
Languages
48.0x
Speed
MIT
License
About Distil-Whisper
Model Info
- ProviderHugging Face
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Často kladené otázky
Distil-Whisper je model prevodu reči na text od spoločnosti Hugging Face. STT.ai hosťuje Distil-Whisper na našej infraštruktúre GPU, takže ho môžete používať bez zriaďovania vlastného hardvéru. Nahrajte zvuk alebo video a vyberte Distil-Whisper z výberu modelu.
V štandardných testoch dosahuje Distil-Whisper okolo 5.8% Word Error Rate.Reálna presnosť závisí od kvality zvuku, prízvuku a jazyka; pre hlučné alebo akcentované nahrávky očakávajte o niekoľko percentuálnych bodov vyššiu WER.
Distil-Whisper beží na bezplatnej úrovni STT.ai - každý návštevník dostane 600 minút / mesiac bezplatne.Platené plány pridávajú dlhšie limity na súbor, súkromné prepisy a prioritné rady.
Distil-Whisper je vydaný pod MIT, povolenou open-source licenciou.Distil-Whisper môžete hosťovať na svojom vlastnom hardvéri alebo použiť našu hosťovanú verziu — obe sú komerčne použiteľné.
Distil-Whisper podporuje 99 jazykov.Automatická detekcia vyberie správny jazyk pre väčšinu zvuku; môžete ho tiež zadať manuálne pre malý nárast presnosti.
Distil-Whisper spracováva zvuk približne 48.0x v reálnom čase na našich grafických procesoroch. 1-hodinový zvukový súbor sa dokončí za menej ako 1 minút. Dlhšie súbory sa ukladajú do frontu a po dokončení sa upozornia e-mailom.
Väčšie modely majú tendenciu byť presnejšie, ale pomalšie; STT.ai hostí Distil-Whisper na GPU, takže počet parametrov neovplyvňuje výkon na strane klienta.
Distil-Whisper prijíma všetky formáty, ktoré podporuje STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI a ďalšie.Výstup ako TXT, SRT, VTT, DOCX, JSON alebo PDF.
Diarizácia hovoriacich beží spolu s Distil-Whisper pre každý prepis — každý hovoriaci je označený a môžete ho neskôr premenovať v editore.
Áno, Distil-Whisper je spustené v našom spravovanom prostredí – zvuk sa predvolene spracováva a odstraňuje a nikdy sa nepoužíva na školenie bez výslovného súhlasu. Plány Pro pridávajú šifrovanie na strane klienta pre prepisy v pokoji.
Použite nástroj compare-stt na porovnanie Distil-Whisper s akýmkoľvek iným podporovaným modelom na rovnakom zvuku. Uvidíte WER, počet segmentov, popisky reproduktorov a skóre spoľahlivosti vedľa seba. Porovnanie Distil-Whisper vs Whisper Large V3 je najčastejšie používané.
Áno. Ako parameter modelu v koncovom bode /v1/transcribe zadajte hodnotu distil-whisper. Súpravy SDK pre jazyk Python a jazyk Node.js obsahujú príklady pre hodnotu Distil-Whisper.
Áno, pretože Distil-Whisper je licencovaný na MIT, môžete ho hosťovať sami.Stránka s otvoreným zdrojovým kódom STT.ai uvádza úložisko projektu a váhy.Väčšina produkčných tímov používa našu hosťovanú verziu na preskočenie obstarávania GPU, výmen modelov a operácií.