Transcribe with Vosk
12.0%
WER
20
Languages
100.0x
Speed
Apache 2.0
License
About Vosk
Languages Supported by Vosk
Model Info
- ProviderAlpha Cephei
- Architecture-
- LicenseApache 2.0
- UpdatedMar 2026
Pogosta vprašanja
Vosk je model govora v tekst z Alpha Cephei. STT.ai gostiteljev Vosk na naši infrastrukturi GPU, tako da ga lahko uporabite, ne da bi zagotovili svojo lastno strojno opremo – naložite zvok ali video in izberite Vosk iz izbirnika modela.
Na standardnih merilih dosega Vosk približno 12.0% Word Napaka. Resnična natančnost je odvisna od kakovosti zvoka, naglasa in jezika; za glasne ali naglašene posnetke, pričakujemo nekaj odstotnih točk višje WER.
Vosk teče na brezplačni stopnji STT.ai – vsak obiskovalec dobi 600 minut/mesečno brez stroškov. Plačani načrti dodajajo več mejnih vrednosti za datoteko, zasebne transkripte in prednostne redke.
Vosk je sproščeno pod Apache 2.0, popustljivo dovoljenje odprtega izvora. Lahko samostojno gostite Vosk na lastni strojnici ali uporabite našo gostiteljsko različico – oba sta komercialno uporabna.
Vosk podpira 20 jezikov. Samodejno odkrivanje izbere pravi jezik za večino avdio; lahko ga tudi ročno navedete za majhno natančnost dvigala.
Vosk procesov avdio ob približno 100.0x v realnem času na naši GPU. 1 urni zvočni datoteka konča v manj kot 8802 minut; daljši datoteki v vrstici in obveščanje po e-pošti, ko se opravi.
Vosk ima STT.ai2 parametrov. Večji modeli so običajno bolj natančni, vendar počasnejši; STT.ai gostiteljev Vosk na GPU, tako da število parametrov ne vpliva na učinkovitost vašega stranke.
Vosk sprejema vse oblike STT.ai podpor – MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI in drugi. Izhod kot TXT, SRT, VTT, DOCX, JSON ali PDF.
Ja. Zvočniška diarizacija teče skupaj z Vosk za vsako transkripcijo – vsak zvočnik je označen in jih lahko kasneje preimenujete v uredniku.
Da. Vosk teče v našem upravljanem okolju – zvok se obdeluje in briše privzeto in nikoli ne uporablja za usposabljanje brez izrecne opt-in. Pro načrti dodati stran stranke šifriranje za transkripte v počitek.
Uporabite orodje primerjave-st, da teče Vosk proti kateremu koli drugemu podprti model na istem zvoku – boste videli WER, segment število, zvočnike, in samozavestne rezultate stran ob strani. Primerjava Vosk vs Whisper Large V3 je najpogostejši zagon.
Da. Navedite "vosk" kot parametr modela na /v1/transcribe end. Python in Node.js SDKs vključujejo Vosk primerov. Brezplačni API stopnja vključuje 100 minut/mesec.
Da. Ker je Vosk Apache 2.0-licenzirano, ga lahko samostojno gostite. STT.ai odprtih strani na seznamu projekta repo in uteži. Večina proizvodnih ekip uporablja našo gostiteljsko različico za preskočitev naročanja GPU, modeli zamenjave in ops.