Transcribe with Distil-Whisper
5.8%
WER
99
Languages
48.0x
Speed
MIT
License
About Distil-Whisper
Model Info
- ProviderHugging Face
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Často kladené otázky
Distil-Whisper je ukázkový model od Hugging Face. STT.ai hostů Distil-Whisper na naší GPU infrastruktuře, takže ji můžete použít bez poskytnutí vlastního hardwaru a nahrát audio nebo video a vybrat Distil-Whisper z modelového sběrače.
Na standardních referenčních hodnotách dosahuje Distil-Whisper přibližně 5.8% Word Error Rate. Skutečná přesnost závisí na kvalitě zvuku, přízvuku a jazyku; u hlučných nebo akcentovaných nahrávek očekáváme o několik procentních bodů vyšší WER.
Distil-Whisper běží na STT.ai volných úrovní, každý návštěvník dostane 600 minut / měsíc bez nákladů. Placené plány přidat déle na-file limity, soukromé přepisy, a prioritní fronty.
Distil-Whisper je uvolněno pod MIT, povolná open-source licence. Můžete self-host Distil-Whisper na vašem vlastním hardwaru, nebo použít naši hostitelskou verzi dírky oba jsou komerčně použitelné.
Distil-Whisper podporuje 99 jazyků. Auto-detekce vybírá správný jazyk pro většinu audio; můžete jej také ručně zadat pro malý výtah přesnosti.
Distil-Whisper zpracovává audio na cca 48.0x v reálném čase na našich GPU. 1-hodinový audio soubor končí za méně než 1 minut; delší fronta souborů a upozornění e-mailem, když je hotovo.
Distil-Whisper má 756M parametrů. Větší modely mají tendenci být přesnější, ale pomalejší; STT.ai hostů Distil-Whisper na GPU, takže počet parametrů nemá vliv na výkon na straně klienta.
Distil-Whisper přijímá každý formát STT.ai podporuje MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI a další. Výstup jako TXT, SRT, VTT, DOCX, JSON, nebo PDF.
Ano. Diarizace reproduktorů vede vedle Distil-Whisper pro každý přepis a každý reproduktor je označen a můžete je přejmenovat v editoru později.
Ano. Distil-Whisper běží v našem řízeném prostředí Audio je zpracováno a smazáno ve výchozím nastavení a nikdy se nepoužívá pro trénink bez explicitního opt-inu. Pro plány přidat klient-strana šifrování pro přepisy v klidu.
Pomocí porovná-stt nástroj spustit Distil-Whisper proti jakémukoliv jinému podporovanému modelu na stejném zvuku, budete vidět WER, počet segmentů, reproduktory štítky, a sebedůvěry skóre vedle sebe. Distil-Whisper vs Whisper Large V3 srovnání je nejčastějším spuštěním.
Ano. Zadejte "distil-whisper" jako parametr modelu na cílovém parametru /v1/transcribe. Python a Node.js SDKs obsahují Distil-Whisper příklady. Bezplatná úroveň API zahrnuje 100 minut/měsíc.
Ano. Vzhledem k tomu, Distil-Whisper je MIT-licencován, můžete si ho sami-hostit. STT.ai open-source stránky uvádí projekt repo a váhy. Většina výrobních týmů používá naši hostitelskou verzi přeskočit GPU zadávání zakázek, modelové swapy, a ops.