Transcribe with Vosk
12.0%
WER
20
Languages
100.0x
Speed
Apache 2.0
License
About Vosk
Languages Supported by Vosk
Model Info
- ProviderAlpha Cephei
- Architecture-
- LicenseApache 2.0
- UpdatedMar 2026
Korduma kippuvad küsimused
Vosk on kõne-teksti mudel Alpha Cephei. STT.ai hosts Vosk meie GPU infrastruktuuri, nii et saate seda kasutada ilma oma riistvara ~ üles laadida audio või video ja valida Vosk mudeli valija.
Standardsete võrdlusandmete puhul saavutab Vosk Wordi veamäära ligikaudu 12.0%. Reaalmaailma täpsus sõltub heli kvaliteedist, aktsendist ja keelest; lärmakate või aktsendiga salvestuste puhul oodake mõnda protsendipunkti kõrgemat WER-i.
Vosk töötab STT.ai vaba tase ~ iga külastaja saab 600 minutit kuus tasuta. Tasulised plaanid lisada enam ühe faili piirangud, era ärakirju, ja prioriteet järjekorda.
Vosk vabastatakse all Apache 2.0, lubatud avatud lähtekoodiga litsentsi. Võite ise-host Vosk oma riistvara või kasutada meie võõrustatud versioon ~ Mõlemad on kaubanduslikult kasutatavad.
Vosk toetab 20 keelt. Automaatne tuvastamine valib enamiku audio jaoks õige keele; seda saab ka käsitsi määrata väikese täpsuse tõstmiseks.
Vosk töötleb audio umbes 100.0x reaalajas meie GPUs. 1-tunnine audiofail lõpetab alla 1 minutit; pikem faile järjekorda ja teatada e-posti teel, kui tehtud.
Vosk on 50M parameetrid. Suuremad mudelid kipuvad olema täpsem, kuid aeglasem; STT.ai hosts Vosk on GPU nii parameeter arv ei mõjuta oma kliendi poolel jõudlust.
Vosk aktsepteerib iga formaat STT.ai toetab ~ MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, jt. Väljund TXT, SRT, VTT, DOX, JSON, või PDF.
Jah. Spiiker diarization töötab kõrvuti Vosk iga transkriptsioon ~ iga kõneleja on märgistatud ja saate ümber nimetada neid toimetaja hiljem.
Jah. Vosk jookseb meie hallatav keskkond ~ audio on töödeldud ja kustutatud vaikimisi ja kunagi kasutada koolitus ilma selge opt-in. Pro plaanid lisada kliendipoolne krüptimine transkriptid puhkeolekus.
Kasutage võrdlus-stt tööriist käivitada Vosk vastu teiste toetatud mudeli sama audio ~ näete WER, segment arv, kõlari sildid, ja enesekindluse skoor külg-küljelt. Vosk vs Whisper Large V3 võrdlus on kõige sagedamini käivitada.
Jah. Täpsustada "vosk" mudeli parameeter /v1/transcrip tulemusnäitaja. Python ja Node.js SDKs sisaldavad Vosk näited. Tasuta API tase sisaldab 100 minutit/kuus.
Jah. Kuna Vosk on Apache 2.0-litsentsiga, saate ise-host seda. STT.ai avatud lähtekoodiga lehekülg loetleb projekti repo ja kaalud. Enamik tootmismeeskonnad kasutavad meie võõrustatud versiooni vahele GPU hanke, mudeli vahetuste ja operatsioonide.