Transcribe with Distil-Whisper
5.8%
WER
99
Languages
48.0x
Speed
MIT
License
About Distil-Whisper
Model Info
- ProviderHugging Face
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Ofta settir spurningar
Distil-Whisper er ein tal-til-tekst-modell frá Hugging Face. STT.ai er hýsa fyri Distil-Whisper á okkara GPU-infrakervi, so tú kanst brúka tað uttan at gera títt egna hardware tilfar - senda inn ljóð ella video og vel Distil-Whisper frá model-veljaranum.
Distil-Whisper hevur eina orðfeilstíð uppá umleið 5.8% í standard próvtøkum. Real-world accuracy depends on audio quality, accent, and language; for noisy or accented recordings, expect a few percentage points higher WER.
Distil-Whisper koyrir á STT.ai1's free tier - hvør vitjandi fær 600 minuttir / mánaða uttan kostnað. gjaldandi ætlanirnar leggja longri per-file markið, private transcripts, og priority queuing.
Distil-Whisper er útgivið undir MIT, einari permissivari opnari upprunaloyvisskipan. Tú kanst sjálvur vera vertur fyri Distil-Whisper á tínum egna maskinvara ella brúka okkara vertur útgávu — báðar eru kommersielt nýtiligar.
Distil-Whisper stuðlar 99 málum. Auto-discover velur rætta málið fyri flestu ljóðini. Tú kanst eisini velja tað manuelt fyri at fáa eina lítla øgiligari nákvæmni.
Distil-Whisper processes audio at about 48.0x real-time on our GPUs. A 1-hour audio file finishes in under 1 minutes; longer files queue and notify by email when done.
Distil-Whisper hevur 756M parametrar. Størri modeller hava til at vera meira nákvæmar, men hægri; STT.ai hevur Distil-Whisper á GPU, so parameter-talið hevur ikki ávirkan á klient-síðuna.
Distil-Whisper tekur ímóti øllum sniðum, sum STT.ai stuðlar — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, og onnur. Úttøka sum TXT, SRT, VTT, DOCX, JSON, ella PDF.
Ja. Speaker diarization runs alongside Distil-Whisper for every transcription — each speaker is labelled and you can rename them in the editor afterwards.
Ja. Distil-Whisper koyrir í okkara umsitingarliga umhvørvi — ljóð verður viðgjørt og slettað sum standard og verður ongantíð brúkt til venjing uttan útgreiniliga atkvøðugreiðslu. Pro-planir leggja til klient-side-kryptering fyri transkriptiónir í hvíld.
No use the compare-stt tool to run Distil-Whisper against any other supported model on the same audio — you'll see WER, segment count, speaker labels, and confidence scores side-by-side. The Distil-Whisper vs Whisper Large V3 comparison is the most commonly run.
Ja. Tilgreina "distil-whisper" sum modelparameter á /v1/transcribe endapunktinum. Python og Node.js SDK'ir innihalda Distil-Whisper dømi. Frítt API-stig fevnir um 100 minuttir/mánað.
Ja. Tí Distil-Whisper er MIT-licensed, tú kanst self-host it. STT.ai's open-source page lists the project repo and weights. Most production teams use our hosted version to skip GPU procurement, model swaps, and ops.