Transcribe with Distil-Whisper
5.8%
WER
99
Languages
48.0x
Speed
MIT
License
About Distil-Whisper
Model Info
- ProviderHugging Face
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Korduma kippuvad küsimused
Distil-Whisper on kõne-teksti mudel Hugging Face. STT.ai hosts Distil-Whisper meie GPU infrastruktuuri, nii et saate seda kasutada ilma oma riistvara ~ üles laadida audio või video ja valida Distil-Whisper mudeli valija.
Standardsete võrdlusandmete puhul saavutab Distil-Whisper Wordi veamäära ligikaudu 5.8%. Reaalmaailma täpsus sõltub heli kvaliteedist, aktsendist ja keelest; lärmakate või aktsendiga salvestuste puhul oodake mõnda protsendipunkti kõrgemat WER-i.
Distil-Whisper töötab STT.ai vaba tase ~ iga külastaja saab 600 minutit kuus tasuta. Tasulised plaanid lisada enam ühe faili piirangud, era ärakirju, ja prioriteet järjekorda.
Distil-Whisper vabastatakse all MIT, lubatud avatud lähtekoodiga litsentsi. Võite ise-host Distil-Whisper oma riistvara või kasutada meie võõrustatud versioon ~ Mõlemad on kaubanduslikult kasutatavad.
Distil-Whisper toetab 99 keelt. Automaatne tuvastamine valib enamiku audio jaoks õige keele; seda saab ka käsitsi määrata väikese täpsuse tõstmiseks.
Distil-Whisper töötleb audio umbes 48.0x reaalajas meie GPUs. 1-tunnine audiofail lõpetab alla 1 minutit; pikem faile järjekorda ja teatada e-posti teel, kui tehtud.
Distil-Whisper on 756M parameetrid. Suuremad mudelid kipuvad olema täpsem, kuid aeglasem; STT.ai hosts Distil-Whisper on GPU nii parameeter arv ei mõjuta oma kliendi poolel jõudlust.
Distil-Whisper aktsepteerib iga formaat STT.ai toetab ~ MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, jt. Väljund TXT, SRT, VTT, DOX, JSON, või PDF.
Jah. Spiiker diarization töötab kõrvuti Distil-Whisper iga transkriptsioon ~ iga kõneleja on märgistatud ja saate ümber nimetada neid toimetaja hiljem.
Jah. Distil-Whisper jookseb meie hallatav keskkond ~ audio on töödeldud ja kustutatud vaikimisi ja kunagi kasutada koolitus ilma selge opt-in. Pro plaanid lisada kliendipoolne krüptimine transkriptid puhkeolekus.
Kasutage võrdlus-stt tööriist käivitada Distil-Whisper vastu teiste toetatud mudeli sama audio ~ näete WER, segment arv, kõlari sildid, ja enesekindluse skoor külg-küljelt. Distil-Whisper vs Whisper Large V3 võrdlus on kõige sagedamini käivitada.
Jah. Täpsustada "distil-whisper" mudeli parameeter /v1/transcrip tulemusnäitaja. Python ja Node.js SDKs sisaldavad Distil-Whisper näited. Tasuta API tase sisaldab 100 minutit/kuus.
Jah. Kuna Distil-Whisper on MIT-litsentsiga, saate ise-host seda. STT.ai avatud lähtekoodiga lehekülg loetleb projekti repo ja kaalud. Enamik tootmismeeskonnad kasutavad meie võõrustatud versiooni vahele GPU hanke, mudeli vahetuste ja operatsioonide.