Transcribe with Distil-Whisper

Funguje s verejne dostupným audio a video. DRM-chránený obsah nie je podporovaný.

Upgrade pre rozšírené
Private transcript
Chat s prepisom
Odomknúť s Pro →
Prejdite sem alebo kliknite pre prehľadávanie
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM - až 2 GB
Upgrade pre rozšírené
Private transcript
Chat s prepisom
Odomknúť s Pro →
Upgrade pre rozšírené
Nahrávanie: 0:00
V reálnom čase Vosk (instantný)
Rozšírené Šepot (presný)
Verejné odkazy: 24h, len text · Prihlásiť sa na odber Pre 7d + audio · Pre Pre súkromné odkazy

Umelá inteligencia automaticky opravuje text, keď hovoríte – presnosť sa zvyšuje s dĺžkou reči.

Najprv otestujte mikrofón
❤️ Milujete STT.ai? Povedzte svojim priateľom!
Použil si svoje bezplatné prepisy

Zaregistrujte sa zdarma a získajte 600 minút mesačne alebo inovujte na neobmedzené prepisy.

10 min./deň zdarma 600 min zadarmo pri registrácii Bez kreditnej karty Šifrované
Zaregistrujte sa zdarma →
5.8%
WER
99
Languages
48.0x
Speed
MIT
License

About Distil-Whisper

Často kladené otázky

Distil-Whisper je model prevodu reči na text od spoločnosti Hugging Face. STT.ai hosťuje Distil-Whisper na našej infraštruktúre GPU, takže ho môžete používať bez zriaďovania vlastného hardvéru. Nahrajte zvuk alebo video a vyberte Distil-Whisper z výberu modelu.

V štandardných testoch dosahuje Distil-Whisper okolo 5.8% Word Error Rate.Reálna presnosť závisí od kvality zvuku, prízvuku a jazyka; pre hlučné alebo akcentované nahrávky očakávajte o niekoľko percentuálnych bodov vyššiu WER.

Distil-Whisper beží na bezplatnej úrovni STT.ai - každý návštevník dostane 600 minút / mesiac bezplatne.Platené plány pridávajú dlhšie limity na súbor, súkromné prepisy a prioritné rady.

Distil-Whisper je vydaný pod MIT, povolenou open-source licenciou.Distil-Whisper môžete hosťovať na svojom vlastnom hardvéri alebo použiť našu hosťovanú verziu — obe sú komerčne použiteľné.

Distil-Whisper podporuje 99 jazykov.Automatická detekcia vyberie správny jazyk pre väčšinu zvuku; môžete ho tiež zadať manuálne pre malý nárast presnosti.

Distil-Whisper spracováva zvuk približne 48.0x v reálnom čase na našich grafických procesoroch. 1-hodinový zvukový súbor sa dokončí za menej ako 1 minút. Dlhšie súbory sa ukladajú do frontu a po dokončení sa upozornia e-mailom.

Väčšie modely majú tendenciu byť presnejšie, ale pomalšie; STT.ai hostí Distil-Whisper na GPU, takže počet parametrov neovplyvňuje výkon na strane klienta.

Distil-Whisper prijíma všetky formáty, ktoré podporuje STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI a ďalšie.Výstup ako TXT, SRT, VTT, DOCX, JSON alebo PDF.

Diarizácia hovoriacich beží spolu s Distil-Whisper pre každý prepis — každý hovoriaci je označený a môžete ho neskôr premenovať v editore.

Áno, Distil-Whisper je spustené v našom spravovanom prostredí – zvuk sa predvolene spracováva a odstraňuje a nikdy sa nepoužíva na školenie bez výslovného súhlasu. Plány Pro pridávajú šifrovanie na strane klienta pre prepisy v pokoji.

Použite nástroj compare-stt na porovnanie Distil-Whisper s akýmkoľvek iným podporovaným modelom na rovnakom zvuku. Uvidíte WER, počet segmentov, popisky reproduktorov a skóre spoľahlivosti vedľa seba. Porovnanie Distil-Whisper vs Whisper Large V3 je najčastejšie používané.

Áno. Ako parameter modelu v koncovom bode /v1/transcribe zadajte hodnotu distil-whisper. Súpravy SDK pre jazyk Python a jazyk Node.js obsahujú príklady pre hodnotu Distil-Whisper.

Áno, pretože Distil-Whisper je licencovaný na MIT, môžete ho hosťovať sami.Stránka s otvoreným zdrojovým kódom STT.ai uvádza úložisko projektu a váhy.Väčšina produkčných tímov používa našu hosťovanú verziu na preskočenie obstarávania GPU, výmen modelov a operácií.