Transcribe with Whisper Large V3

Funguje s verejne dostupným audio a video. DRM-chránený obsah nie je podporovaný.

Upgrade pre rozšírené
Private transcript
Chat s prepisom
Odomknúť s Pro →
Prejdite sem alebo kliknite pre prehľadávanie
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM - až 2 GB
Upgrade pre rozšírené
Private transcript
Chat s prepisom
Odomknúť s Pro →
Upgrade pre rozšírené
Nahrávanie: 0:00
V reálnom čase Vosk (instantný)
Rozšírené Šepot (presný)
Verejné odkazy: 24h, len text · Prihlásiť sa na odber Pre 7d + audio · Pre Pre súkromné odkazy

Umelá inteligencia automaticky opravuje text, keď hovoríte – presnosť sa zvyšuje s dĺžkou reči.

Najprv otestujte mikrofón
❤️ Milujete STT.ai? Povedzte svojim priateľom!
Použil si svoje bezplatné prepisy

Zaregistrujte sa zdarma a získajte 600 minút mesačne alebo inovujte na neobmedzené prepisy.

10 min./deň zdarma 600 min zadarmo pri registrácii Bez kreditnej karty Šifrované
Zaregistrujte sa zdarma →
4.2%
WER
99
Languages
8.0x
Speed
MIT
License

About Whisper Large V3

Často kladené otázky

Whisper Large V3 je model prevodu reči na text od spoločnosti OpenAI. STT.ai hosťuje Whisper Large V3 na našej infraštruktúre GPU, takže ho môžete používať bez zriaďovania vlastného hardvéru. Nahrajte zvuk alebo video a vyberte Whisper Large V3 z výberu modelu.

V štandardných testoch dosahuje Whisper Large V3 okolo 4.2% Word Error Rate.Reálna presnosť závisí od kvality zvuku, prízvuku a jazyka; pre hlučné alebo akcentované nahrávky očakávajte o niekoľko percentuálnych bodov vyššiu WER.

Whisper Large V3 beží na bezplatnej úrovni STT.ai - každý návštevník dostane 600 minút / mesiac bezplatne.Platené plány pridávajú dlhšie limity na súbor, súkromné prepisy a prioritné rady.

Whisper Large V3 je vydaný pod MIT, povolenou open-source licenciou.Whisper Large V3 môžete hosťovať na svojom vlastnom hardvéri alebo použiť našu hosťovanú verziu — obe sú komerčne použiteľné.

Whisper Large V3 podporuje 99 jazykov.Automatická detekcia vyberie správny jazyk pre väčšinu zvuku; môžete ho tiež zadať manuálne pre malý nárast presnosti.

Whisper Large V3 spracováva zvuk približne 8.0x v reálnom čase na našich grafických procesoroch. 1-hodinový zvukový súbor sa dokončí za menej ako 7 minút. Dlhšie súbory sa ukladajú do frontu a po dokončení sa upozornia e-mailom.

Väčšie modely majú tendenciu byť presnejšie, ale pomalšie; STT.ai hostí Whisper Large V3 na GPU, takže počet parametrov neovplyvňuje výkon na strane klienta.

Whisper Large V3 prijíma všetky formáty, ktoré podporuje STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI a ďalšie.Výstup ako TXT, SRT, VTT, DOCX, JSON alebo PDF.

Diarizácia hovoriacich beží spolu s Whisper Large V3 pre každý prepis — každý hovoriaci je označený a môžete ho neskôr premenovať v editore.

Áno, Whisper Large V3 je spustené v našom spravovanom prostredí – zvuk sa predvolene spracováva a odstraňuje a nikdy sa nepoužíva na školenie bez výslovného súhlasu. Plány Pro pridávajú šifrovanie na strane klienta pre prepisy v pokoji.

Použite nástroj compare-stt na porovnanie Whisper Large V3 s akýmkoľvek iným podporovaným modelom na rovnakom zvuku. Uvidíte WER, počet segmentov, popisky reproduktorov a skóre spoľahlivosti vedľa seba. Porovnanie Whisper Large V3 vs Whisper Large V3 je najčastejšie používané.

Áno. Ako parameter modelu v koncovom bode /v1/transcribe zadajte hodnotu whisper-large-v3. Súpravy SDK pre jazyk Python a jazyk Node.js obsahujú príklady pre hodnotu Whisper Large V3.

Áno, pretože Whisper Large V3 je licencovaný na MIT, môžete ho hosťovať sami.Stránka s otvoreným zdrojovým kódom STT.ai uvádza úložisko projektu a váhy.Väčšina produkčných tímov používa našu hosťovanú verziu na preskočenie obstarávania GPU, výmen modelov a operácií.