Nahlásiť chybu / požiadavku na funkciu

Prepisovať s Vosk

Name: Vosk
Author: Alpha Cephei

Funguje s verejne dostupným audio a video. DRM-chránený obsah nie je podporovaný.

Upgrade pre rozšírené

Súkromný prepis

Chat s prepisom

Odomknúť s Pro →

Prejdite sem alebo kliknite pre prehľadávanie

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM - až 2 GB

Hromadné nahrávanie viacerých súborov S Pro verziou

Upgrade pre rozšírené

Súkromný prepis

Chat s prepisom

Odomknúť s Pro →

Upgrade pre rozšírené

Umelá inteligencia automaticky opravuje text, keď hovoríte – presnosť sa zvyšuje s dĺžkou reči.

Najprv otestujte mikrofón

10 min./deň zdarma 600 min zadarmo pri registrácii Bez kreditnej karty Šifrované

Zaregistrujte sa zdarma →

12.0%

WER

Jazyky

100.0x

Rýchlosť

Apache 2.0

Licencia

O nás Vosk

Vosk je offline rozpoznávač reči, ktorý funguje bez pripojenia k internetu.Podporuje viac ako 20 jazykov s kompaktnými modelmi, ktoré môžu bežať na mobilných zariadeniach, Raspberry Pi a akejkoľvek platforme.Postavený na Kaldi a Zipformer architektúry.

Jazyky podporované Vosk

Angličtina

Španielčina

Francúzština

Nemčina

Čínština

Japončina

Kórejčina

Portugalčina

Arabčina

Hindčina

Ruština

Taliančina

Holandčina

Turečtina

Poľština

Švédčina

Indonézština

Vietnamčina

Čeština

Gréčtina

Informácie o modeli

PoskytovateľAlpha Cephei
Architektúra-
LicenciaApache 2.0
AktualizovanéMar 2026

Súvisiace modely 1

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Často kladené otázky

Vosk je model prevodu reči na text od spoločnosti Alpha Cephei. STT.ai hosťuje Vosk na našej infraštruktúre GPU, takže ho môžete používať bez zriaďovania vlastného hardvéru. Nahrajte zvuk alebo video a vyberte Vosk z výberu modelu.

V štandardných testoch dosahuje Vosk okolo 12.0% Word Error Rate.Reálna presnosť závisí od kvality zvuku, prízvuku a jazyka; pre hlučné alebo akcentované nahrávky očakávajte o niekoľko percentuálnych bodov vyššiu WER.

Vosk beží na bezplatnej úrovni STT.ai - každý návštevník dostane 600 minút na spustenie bez poplatkov.Platené plány pridávajú dlhšie limity na súbor, súkromné prepisy a prioritné rady.

Vosk je vydaný pod Apache 2.0, povolenou open-source licenciou.Vosk môžete hosťovať na svojom vlastnom hardvéri alebo použiť našu hosťovanú verziu — obe sú komerčne použiteľné.

Vosk podporuje 20 jazykov.Automatická detekcia vyberie správny jazyk pre väčšinu zvuku; môžete ho tiež zadať manuálne pre malý nárast presnosti.

Vosk spracováva zvuk približne 100.0x v reálnom čase na našich grafických procesoroch. 1-hodinový zvukový súbor sa dokončí za menej ako 1 minút. Dlhšie súbory sa ukladajú do frontu a po dokončení sa upozornia e-mailom.

Väčšie modely majú tendenciu byť presnejšie, ale pomalšie; STT.ai hostí Vosk na GPU, takže počet parametrov neovplyvňuje výkon na strane klienta.

Vosk prijíma všetky formáty, ktoré podporuje STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI a ďalšie.Výstup ako TXT, SRT, VTT, DOCX, JSON alebo PDF.

Diarizácia hovoriacich beží spolu s Vosk pre každý prepis — každý hovoriaci je označený a môžete ho neskôr premenovať v editore.

Áno, Vosk je spustené v našom spravovanom prostredí – zvuk sa predvolene spracováva a odstraňuje a nikdy sa nepoužíva na školenie bez výslovného súhlasu. Plány Pro pridávajú šifrovanie na strane klienta pre prepisy v pokoji.

Použite nástroj compare-stt na porovnanie Vosk s akýmkoľvek iným podporovaným modelom na rovnakom zvuku. Uvidíte WER, počet segmentov, popisky reproduktorov a skóre spoľahlivosti vedľa seba. Porovnanie Vosk vs Whisper Large V3 je najčastejšie používané.

Áno. Ako parameter modelu v koncovom bode /v1/transcribe zadajte hodnotu vosk. Súpravy SDK pre jazyk Python a jazyk Node.js obsahujú príklady pre hodnotu Vosk.

Áno, pretože Vosk je licencovaný na Apache 2.0, môžete ho hosťovať sami.Stránka s otvoreným zdrojovým kódom STT.ai uvádza úložisko projektu a váhy.Väčšina produkčných tímov používa našu hosťovanú verziu na preskočenie obstarávania GPU, výmen modelov a operácií.

Prepisovať s Vosk

O nás Vosk

Jazyky podporované Vosk

Informácie o modeli

Súvisiace modely 1

Často kladené otázky

Čo je Vosk?

Ako presné je Vosk?

Je Vosk zadarmo na použitie?

Akú licenciu používa Vosk?

Koľko jazykov podporuje Vosk?

Ako rýchlo je Vosk?

Aký veľký je model Vosk?

Aké audio formáty dokáže Vosk prepisovať?

Zisťuje Vosk viacero reproduktorov?

Sú moje dáta súkromné pri používaní Vosk?

Ako sa Vosk porovnáva s inými modelmi STT?

Môžem použiť Vosk cez API?

Môžem spustiť Vosk na vlastnom serveri?