Transcribe with Vosk
12.0%
WER
20
Languages
100.0x
Speed
Apache 2.0
License
About Vosk
Languages Supported by Vosk
Model Info
- ProviderAlpha Cephei
- Architecture-
- LicenseApache 2.0
- UpdatedMar 2026
Bieži uzdoti jautājumi
Vosk ir runas-teksta modelis līdz Alpha Cephei. STT.ai uzstādā Vosk mūsu GPU infrastruktūrā, lai jūs varētu to izmantot, nenodrošinot savu aparatūru — augšupielādēt audio vai video un izvēlēties Vosk no modeļa izvēlētājs.
Par standarta etaloniem 8801% sasniedz aptuveni 8801% vārdu kļūdu rādītājs. Reālā pasaules precizitāte ir atkarīga no audio kvalitātes, akcenta un valodas; trokšņainiem vai izceltiem ierakstiem, sagaida dažus procentu punktus augstāka WER.
Vosk iet uz STT.ai bezmaksas līmeni – katrs apmeklētājs saņem 600 minūtes/mēnesi bez maksas. Maksājamie plāni pievienot ilgākus ierobežojumus par failu, privātus transkriptus, un prioritātes rindas.
Vosk tiek izlaists zem Apache 2.0, atļautā atvērtā pirmkoda licence. Jūs varat paša-host Vosk uz savu aparatūru vai izmantot mūsu hostinga versiju — abi ir komerciāli izmantojami.
Vosk atbalsta 20 valodas. Auto-noteikšana izvēlas pareizo valodu lielākajai daļai audio; jūs varat arī norādīt to manuāli, lai mazs precizitātes pacēlājs.
Vosk apstrādā audio apmēram 100.0x reāllaikā mūsu GPU. 1 stundu audio fails beidzas zem 1 minūtēm; ilgāka failu rinda un paziņo pa e-pastu, kad izdarīts.
Vosk ir 50M parametri. Lielāki modeļi mēdz būt precīzāki, bet lēnāki; STT.ai saimnieki Vosk par GPU, tāpēc parametru skaits neietekmē jūsu klientu veiktspēju.
Vosk pieņem katru formātu STT.ai atbalsta - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI un citi. Izlaide kā TXT, SRT, VTT, DOCX, JSON, vai PDF.
Jā. Skaļruņa diarizācija notiek līdzās 88 000 par katru transkripciju — katrs runātājs ir marķēts un jūs varat pārdēvēt tos redaktorā pēc tam.
Jā. Vosk darbojas mūsu pārvaldītajā vidē — audio tiek apstrādāts un dzēsts pēc noklusējuma un nekad netiek izmantots apmācībai bez skaidra opt-in. Pro plāni pievienot klienta pusē šifrēšanu transkriptiem miera stāvoklī.
Izmantojiet salīdzināšanas-stt rīku, lai palaistu Vosk pret jebkuru citu atbalstīto modeli tajā pašā audio — jūs redzēsiet WER, segmentu skaitu, skaļruņu etiķetes un uzticamības punktus blakus-by-by. Vosk vs Whisper Lielo V3 salīdzinājums ir visbiežāk palaist.
Jā. Norādīt "vosk" kā modeļa parametru /v1/tractor galapunktā. Python un Node.js SDK ietver Vosk piemērus. Bezmaksas API līmenis ietver 100 minūtes/mēnesi.
Jā. Tā kā Vosk ir licences Apache 2.0, jūs varat paši-host to. STT.ai atvērtā pirmkoda lapā uzskaitīti projekta repo un svaru. Lielākā daļa ražošanas komandas izmanto mūsu hostinga versiju, lai izlaistu GPU iepirkumu, modeļu mijmaiņas darījumi, un opcijas.