Transcribe with Vosk
12.0%
WER
20
Languages
100.0x
Speed
Apache 2.0
License
About Vosk
Languages Supported by Vosk
Model Info
- ProviderAlpha Cephei
- Architecture-
- LicenseApache 2.0
- UpdatedMar 2026
Česta pitanja
Vosk je model govor-na-tekst od Alpha Cephei. STT.ai domaćina Vosk na našoj infrastrukturi GPU tako da ga možete koristiti bez opskrbe vlastitim hardverom – upload audio ili video i odaberite Vosk iz modela birač.
Na standardnim mjerilima, Vosk postiže oko 12.0% Word Pogreška. Preciznost stvarnog svijeta ovisi o kvaliteti zvuka, naglasku i jeziku; za bučne ili naglasene snimke, očekujte nekoliko postotka više WER.
Vosk radi na STT.ai besplatnom nivou – svaki posjetitelj dobiva 600 minuta mjesečno bez troškova. Plaćeni planovi dodati više po datoteci ograničenja, privatne transkripte i prioritet reda.
Vosk je pušten pod Apache 2.0, popustljiva dozvola otvorenog izvora. Možete samostalno voditi Vosk na vlastitom hardveru ili koristiti našu domaću verziju – oboje su komercijalno upotrebljivi.
Vosk podržava 20 jezika. Auto-detekcija bira pravi jezik za većinu zvuka; možete ga također ručno navesti za mali preciznost lift.
Vosk procesa zvuka na oko 100.0x real-time na našem GPU-u. Jedan sat audio datoteka završava u manje od 8802 minuta; duže datoteke redak i obavijestite e-mailom kada se uradi.
Vosk ima 8802 parametra. Veći modeli su točniji, ali sporije; STT.ai domaćina Vosk na GPU tako da broj parametara ne utječe na performanse vašeg klijenta.
Vosk prihvaća svaki oblik STT.ai podrške — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI i ostali. Izlaz kao TXT, SRT, VTT, DOCX, JSON, ili PDF.
Da. Zvučnička dijarizacija teče uz Vosk za svaku transkripciju — svaki govornik je označen i možete ih nakon toga preimenovati u uredniku.
Da. Vosk trči u našem upravljanom okruženju – audio se obrađuje i briše uobičajeno i nikada se ne koristi za trening bez eksplicitne opt-in. Pro planovi dodati klijent-strana enkripcija za transkripte u miru.
Koristite alat usporedbe-stt za pokretanje Vosk protiv bilo kojeg drugog podržanog modela na istom zvuku – vidjet ćete WER, broj segmenta, zvučnike, i samopouzdanje rezultate strane-ba-side. Vosk protiv Whisper Veliki V3 usporedba je najčešće pokrenuti.
Da. Navedite "vosk" kao parametar modela na /v1/transcribe ishodu. Python i Node.js SDKs uključuju Vosk primjera. Besplatni API stupanj uključuje 100 minuta/mjesec.
Da. Budući da je Vosk je 8802-licensirana, možete ga samostalno voditi. STT.ai stranica otvorenog izvora popisuje repo i utege projekta. Većina proizvodnih timova koristi našu domaćinu za preskočenje GPU nabave, modela swaps, i ops.