Transcribe with Distil-Whisper

Pracuje s veřejně dostupným audio & video. DRM-chráněný obsah není podporován.

Upgrade pro vylepšené
Private transcript
Chat s přepisem
Odemknout s Pro →
Drop soubor zde nebo klikněte na prohlížení
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM do 2GB
Upgrade pro vylepšené
Private transcript
Chat s přepisem
Odemknout s Pro →
Upgrade pro vylepšené
Nahrávání: 0:00
V reálném čase Vosk (v okamžiku)
Rozšířené Šepot (přesný)
Veřejné odkazy: 24h, pouze text · Zaregistrovat se pro 7d + audio · Pro pro soukromé spoje

V reálném čase řeč k textu. AI auto-opravy, jak mluvíte, přesnost se zlepšuje s delší řečí.

Nejdřív si otestuj mikrofon.
❤️ Love STT.ai? Tell your friends!
Použil jsi své svobodné přepisy.

Zaregistrujte se zdarma získat 600 minut / měsíc, nebo upgrade pro neomezené přepisy.

10 volných min/den 600 min zdarma s přihlášením Žádná kreditní karta Zašifrováno
Zaregistrujte se zdarma →
5.8%
WER
99
Languages
48.0x
Speed
MIT
License

About Distil-Whisper

Často kladené otázky

Distil-Whisper je ukázkový model od Hugging Face. STT.ai hostů Distil-Whisper na naší GPU infrastruktuře, takže ji můžete použít bez poskytnutí vlastního hardwaru a nahrát audio nebo video a vybrat Distil-Whisper z modelového sběrače.

Na standardních referenčních hodnotách dosahuje Distil-Whisper přibližně 5.8% Word Error Rate. Skutečná přesnost závisí na kvalitě zvuku, přízvuku a jazyku; u hlučných nebo akcentovaných nahrávek očekáváme o několik procentních bodů vyšší WER.

Distil-Whisper běží na STT.ai volných úrovní, každý návštěvník dostane 600 minut / měsíc bez nákladů. Placené plány přidat déle na-file limity, soukromé přepisy, a prioritní fronty.

Distil-Whisper je uvolněno pod MIT, povolná open-source licence. Můžete self-host Distil-Whisper na vašem vlastním hardwaru, nebo použít naši hostitelskou verzi dírky oba jsou komerčně použitelné.

Distil-Whisper podporuje 99 jazyků. Auto-detekce vybírá správný jazyk pro většinu audio; můžete jej také ručně zadat pro malý výtah přesnosti.

Distil-Whisper zpracovává audio na cca 48.0x v reálném čase na našich GPU. 1-hodinový audio soubor končí za méně než 1 minut; delší fronta souborů a upozornění e-mailem, když je hotovo.

Distil-Whisper má 756M parametrů. Větší modely mají tendenci být přesnější, ale pomalejší; STT.ai hostů Distil-Whisper na GPU, takže počet parametrů nemá vliv na výkon na straně klienta.

Distil-Whisper přijímá každý formát STT.ai podporuje MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI a další. Výstup jako TXT, SRT, VTT, DOCX, JSON, nebo PDF.

Ano. Diarizace reproduktorů vede vedle Distil-Whisper pro každý přepis a každý reproduktor je označen a můžete je přejmenovat v editoru později.

Ano. Distil-Whisper běží v našem řízeném prostředí Audio je zpracováno a smazáno ve výchozím nastavení a nikdy se nepoužívá pro trénink bez explicitního opt-inu. Pro plány přidat klient-strana šifrování pro přepisy v klidu.

Pomocí porovná-stt nástroj spustit Distil-Whisper proti jakémukoliv jinému podporovanému modelu na stejném zvuku, budete vidět WER, počet segmentů, reproduktory štítky, a sebedůvěry skóre vedle sebe. Distil-Whisper vs Whisper Large V3 srovnání je nejčastějším spuštěním.

Ano. Zadejte "distil-whisper" jako parametr modelu na cílovém parametru /v1/transcribe. Python a Node.js SDKs obsahují Distil-Whisper příklady. Bezplatná úroveň API zahrnuje 100 minut/měsíc.

Ano. Vzhledem k tomu, Distil-Whisper je MIT-licencován, můžete si ho sami-hostit. STT.ai open-source stránky uvádí projekt repo a váhy. Většina výrobních týmů používá naši hostitelskou verzi přeskočit GPU zadávání zakázek, modelové swapy, a ops.