Transcribe with Distil-Whisper
5.8%
WER
99
Languages
48.0x
Speed
MIT
License
About Distil-Whisper
Model Info
- ProviderHugging Face
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Pitakon kang asring diajukake
STT.ai host Distil-Whisper ing infrastruktur GPU kita supaya sampeyan bisa nggunakake tanpa provisioning piranti lunak dhewe - upload audio utawa video lan pilih Distil-Whisper saka model pitcher.
Ing standar benchmarks, Distil-Whisper ngrampungake sekitar 5.8% Word Error Rate. Real-world akurasi gumantung ing kualitas audio, accent, lan basa; kanggo noisey utawa accented rekaman, ngarepake sawetara persentase poin luwih dhuwur WER.
Distil-Whisper dioperasikaké ing tingkat gratis STT.ai - saben pengunjung nampa 600 menit / wulan tanpa biaya. rencana dibayar nambah watesan per-file sing luwih dawa, transkripsi pribadi, lan prioritas queueing.
Distil-Whisper dirilis ing ngisor MIT, lisensi sumber terbuka sing permisif. Sampeyan bisa nginstal Distil-Whisper ing piranti keras dhewe utawa nggunakake versi sing dihost - loro-loroné bisa digunakake kanthi komersial.
Distil-Whisper nyokong 99 basa. Auto-deteksi milih basa kang bener kanggo akèh audio; sampeyan uga bisa nyetel kanthi manual kanggo nambah akurasi.
Distil-Whisper ngproses audio ing kira-kira 48.0x real-time ing GPU kita. Fail audio 1 jam rampung ing ngisor 1 menit; file luwih dawa ing gulungan lan dilaporake liwat email nalika rampung.
Distil-Whisper duwé parameter 756M. Model kang luwih gedhé luwih akurat nanging luwih lambat; STT.ai duwé host Distil-Whisper ing GPU supaya penghitungan parameter ora ngrusak kinerja klien.
Distil-Whisper nampa saben format STT.ai nyokong - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, lan liyane. Output minangka TXT, SRT, VTT, DOCX, JSON, utawa PDF.
Distil-Whisper diarization speakers dijalanaken kaliyan saben transkripsi - saben speaker dipunlabel lan sampeyan saged mènèhi jeneng anyar ing editor.
Ya. Distil-Whisper dijalanaké ing lingkungan sing diurus — audio diproses lan dipasak kanthi pigura lan ora pernah digunakake kanggo latihan tanpa opt-in eksplisit. Rencana Pro nambah enkripsi klien-sisi kanggo transkripsi nalika ora aktif.
Gunakaké alat compare-stt kanggo nglakokaké Distil-Whisper karo modél liya kang didhukung ing audio kang padha — sampeyan bakal ndeleng WER, penghitung segmen, label speaker, lan skor confidence side-by-side. Perbandingan Distil-Whisper vs Whisper Large V3 iku sing paling umum dilakokaké.
Ya. Nyathet "distil-whisper" minangka parameter model ing /v1/transcribe endpoint. Python lan Node.js SDKs ngemot conto Distil-Whisper. Lapisan API gratis ngemot 100 menit/wulan.
Ya. Amargi Distil-Whisper dipunlisensi MIT, sampeyan saged nghostaken piyambakipun. Lampiran sumber-bukah STT.ai nyathet repo proyèk lan bobot. Kathah tim produksi ingkang ngginakaken versi ingkang dipunhostaken kanggé nglewati GPU procurement, model swaps, lan ops.