Transcribe with Distil-Whisper

Nggawe karo audio lan video kang ana ing donya. Kandungan kang dilindhungi DRM ora didhukung.

Upgrade for Enhanced
Private transcript
Chat karo transcript
Ditutup karo Pro →
Gunakake file iki kanggo nyalin lan nempel
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — nganti 2GB
Upgrade for Enhanced
Private transcript
Chat karo transcript
Ditutup karo Pro →
Upgrade for Enhanced
Rekaman: 0:00
Real-time Lilin (seda)
Dioptimalake Wiwit iku (ing basa Jawa)
24 jam, 24 jam, 24 jam, 24 jam, 24 jam. · Langganan kanggo 7d + audio · Pro for private links

Real-time speech to text. AI auto-corrects nalika sampeyan ngomong - akurasi tambah karo basa sing luwih dawa.

Uji mikrofonmu pisanan
❤️ STT.ai? Nyathet kanca-kancamu!
Sampeyan wis nggunakake transkripsi gratis sampeyan

Ing taun 1996, dhèwèké gabung karo grup musik 600 Minutes, lan wiwit main ing acara-acara hiburan.

10 menit/dina 600 min gratis karo signup Ora ana kertu kredit Dienkripsi
Sign up free →
5.8%
WER
99
Languages
48.0x
Speed
MIT
License

About Distil-Whisper

Pitakon kang asring diajukake

STT.ai host Distil-Whisper ing infrastruktur GPU kita supaya sampeyan bisa nggunakake tanpa provisioning piranti lunak dhewe - upload audio utawa video lan pilih Distil-Whisper saka model pitcher.

Ing standar benchmarks, Distil-Whisper ngrampungake sekitar 5.8% Word Error Rate. Real-world akurasi gumantung ing kualitas audio, accent, lan basa; kanggo noisey utawa accented rekaman, ngarepake sawetara persentase poin luwih dhuwur WER.

Distil-Whisper dioperasikaké ing tingkat gratis STT.ai - saben pengunjung nampa 600 menit / wulan tanpa biaya. rencana dibayar nambah watesan per-file sing luwih dawa, transkripsi pribadi, lan prioritas queueing.

Distil-Whisper dirilis ing ngisor MIT, lisensi sumber terbuka sing permisif. Sampeyan bisa nginstal Distil-Whisper ing piranti keras dhewe utawa nggunakake versi sing dihost - loro-loroné bisa digunakake kanthi komersial.

Distil-Whisper nyokong 99 basa. Auto-deteksi milih basa kang bener kanggo akèh audio; sampeyan uga bisa nyetel kanthi manual kanggo nambah akurasi.

Distil-Whisper ngproses audio ing kira-kira 48.0x real-time ing GPU kita. Fail audio 1 jam rampung ing ngisor 1 menit; file luwih dawa ing gulungan lan dilaporake liwat email nalika rampung.

Distil-Whisper duwé parameter 756M. Model kang luwih gedhé luwih akurat nanging luwih lambat; STT.ai duwé host Distil-Whisper ing GPU supaya penghitungan parameter ora ngrusak kinerja klien.

Distil-Whisper nampa saben format STT.ai nyokong - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, lan liyane. Output minangka TXT, SRT, VTT, DOCX, JSON, utawa PDF.

Distil-Whisper diarization speakers dijalanaken kaliyan saben transkripsi - saben speaker dipunlabel lan sampeyan saged mènèhi jeneng anyar ing editor.

Ya. Distil-Whisper dijalanaké ing lingkungan sing diurus — audio diproses lan dipasak kanthi pigura lan ora pernah digunakake kanggo latihan tanpa opt-in eksplisit. Rencana Pro nambah enkripsi klien-sisi kanggo transkripsi nalika ora aktif.

Gunakaké alat compare-stt kanggo nglakokaké Distil-Whisper karo modél liya kang didhukung ing audio kang padha — sampeyan bakal ndeleng WER, penghitung segmen, label speaker, lan skor confidence side-by-side. Perbandingan Distil-Whisper vs Whisper Large V3 iku sing paling umum dilakokaké.

Ya. Nyathet "distil-whisper" minangka parameter model ing /v1/transcribe endpoint. Python lan Node.js SDKs ngemot conto Distil-Whisper. Lapisan API gratis ngemot 100 menit/wulan.

Ya. Amargi Distil-Whisper dipunlisensi MIT, sampeyan saged nghostaken piyambakipun. Lampiran sumber-bukah STT.ai nyathet repo proyèk lan bobot. Kathah tim produksi ingkang ngginakaken versi ingkang dipunhostaken kanggé nglewati GPU procurement, model swaps, lan ops.