Transcribe with Distil-Whisper
5.8%
WER
99
Languages
48.0x
Speed
MIT
License
About Distil-Whisper
Model Info
- ProviderHugging Face
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Bieži uzdoti jautājumi
Distil-Whisper ir runas-teksta modelis līdz Hugging Face. STT.ai uzstādā Distil-Whisper mūsu GPU infrastruktūrā, lai jūs varētu to izmantot, nenodrošinot savu aparatūru — augšupielādēt audio vai video un izvēlēties Distil-Whisper no modeļa izvēlētājs.
Par standarta etaloniem 8801% sasniedz aptuveni 8801% vārdu kļūdu rādītājs. Reālā pasaules precizitāte ir atkarīga no audio kvalitātes, akcenta un valodas; trokšņainiem vai izceltiem ierakstiem, sagaida dažus procentu punktus augstāka WER.
Distil-Whisper iet uz STT.ai bezmaksas līmeni – katrs apmeklētājs saņem 600 minūtes/mēnesi bez maksas. Maksājamie plāni pievienot ilgākus ierobežojumus par failu, privātus transkriptus, un prioritātes rindas.
Distil-Whisper tiek izlaists zem MIT, atļautā atvērtā pirmkoda licence. Jūs varat paša-host Distil-Whisper uz savu aparatūru vai izmantot mūsu hostinga versiju — abi ir komerciāli izmantojami.
Distil-Whisper atbalsta 99 valodas. Auto-noteikšana izvēlas pareizo valodu lielākajai daļai audio; jūs varat arī norādīt to manuāli, lai mazs precizitātes pacēlājs.
Distil-Whisper apstrādā audio apmēram 48.0x reāllaikā mūsu GPU. 1 stundu audio fails beidzas zem 1 minūtēm; ilgāka failu rinda un paziņo pa e-pastu, kad izdarīts.
Distil-Whisper ir 756M parametri. Lielāki modeļi mēdz būt precīzāki, bet lēnāki; STT.ai saimnieki Distil-Whisper par GPU, tāpēc parametru skaits neietekmē jūsu klientu veiktspēju.
Distil-Whisper pieņem katru formātu STT.ai atbalsta - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI un citi. Izlaide kā TXT, SRT, VTT, DOCX, JSON, vai PDF.
Jā. Skaļruņa diarizācija notiek līdzās 88 000 par katru transkripciju — katrs runātājs ir marķēts un jūs varat pārdēvēt tos redaktorā pēc tam.
Jā. Distil-Whisper darbojas mūsu pārvaldītajā vidē — audio tiek apstrādāts un dzēsts pēc noklusējuma un nekad netiek izmantots apmācībai bez skaidra opt-in. Pro plāni pievienot klienta pusē šifrēšanu transkriptiem miera stāvoklī.
Izmantojiet salīdzināšanas-stt rīku, lai palaistu Distil-Whisper pret jebkuru citu atbalstīto modeli tajā pašā audio — jūs redzēsiet WER, segmentu skaitu, skaļruņu etiķetes un uzticamības punktus blakus-by-by. Distil-Whisper vs Whisper Lielo V3 salīdzinājums ir visbiežāk palaist.
Jā. Norādīt "distil-whisper" kā modeļa parametru /v1/tractor galapunktā. Python un Node.js SDK ietver Distil-Whisper piemērus. Bezmaksas API līmenis ietver 100 minūtes/mēnesi.
Jā. Tā kā Distil-Whisper ir licences MIT, jūs varat paši-host to. STT.ai atvērtā pirmkoda lapā uzskaitīti projekta repo un svaru. Lielākā daļa ražošanas komandas izmanto mūsu hostinga versiju, lai izlaistu GPU iepirkumu, modeļu mijmaiņas darījumi, un opcijas.