Transcribe with Vosk
12.0%
WER
20
Languages
100.0x
Speed
Apache 2.0
License
About Vosk
Languages Supported by Vosk
Model Info
- ProviderAlpha Cephei
- Architecture-
- LicenseApache 2.0
- UpdatedMar 2026
Често постављана питања
Vosk је модел говор-текст од Alpha Cephei. STT.ai домаћина Vosk на нашој ГПУ инфраструктури тако да га можете користити без обезбеђења сопственог хардвера — слање аудио или видео и одабирање Vosk из модела берача.
На стандардним стандардним стандардима, Vosk постиже око 12.0% процена грешака речи. Прецизност реалног света зависи од квалитета звука, акцента и језика; за бучне или акцентиране снимке, очекује се неколико процената вишег ВЕР‐ а.
Vosk ради на STT.ai-овом слободном нивоу — сваки посетилац добија 600 минута месечно без трошкова. Плаћени планови додају више граница по фајлу, приватне транскрипте и приоритетне редоследе.
Vosk је ослобођено под Apache 2.0, попустљива дозвола отвореног извора, можете да водите Vosk на сопственом хардверу или да користите нашу верзију домаћина — оба су комерцијално коришћена.
Vosk подржава 20 језике. Аутоматско откривање изабира прави језик за већину звука; такође га ручно можете задати за мали лифт тачности.
Vosk процесира звук на око 100.0x реално време на нашим ГПУ‐ овима. Један сат аудио фајла завршава испод 8802 минута; дуже фајлове у реду и обавештење е‐ поштом.
Vosk има 8802 параметра. Већи модели обично су прецизнији, али спорији; STT.ai домаћина Vosk на ГПУ, тако да број параметара не утиче на перформансе вашег клијента.
Vosk прихвата сваки формат STT.ai подршке — МП3, ВАВ, М4А, ФЛАЦ, ОГГ, МП4, МКВ, МОВ, ВебМ, АВИ и остали. Излаз као ТХТ, СРТ, ВТТ, ДОКС, ЈСОН или ПДФ.
Дијаризација звучника ради поред Vosk за сваку транскрипцију — сваки звучник је означен и можете да их преименујете у уређивачу после тога.
Да. Vosk ради у нашем управљеном окружењу — аудио се обрађује и обрише подразум› ијевано и никада се не користи за обуку без експлицитне опције. Про планови додају шифровање са стране клијента за транскрипте у миру.
Користите алатку за упоређивање да покренете Vosk против било ког другог подржаног модела на истом звуку — видећете ВЕР, број сегмента, налепнице звучника и поверљиве резултате са стране поред. Најчешће је поређење Vosk против Whisper Велики В3.
Да. Задајте „ vosk “ као параметар модела на крајњој тачки /v1/transcribed. Питон и Node.js СДК укључују Vosk примера. Слободни АПИ низ укључује 100 минута/месечно.
Да, зато што је Vosk 8802-лицензиран, можете да га водите. STT.ai отворене странице набраја репо и тежине пројекта. Већина продуцентских тимова користи нашу домаћинску верзију да прескочите ГПУ набавке, замене модела и операције.