Transcribe with Vosk
12.0%
WER
20
Languages
100.0x
Speed
Apache 2.0
License
About Vosk
Languages Supported by Vosk
Model Info
- ProviderAlpha Cephei
- Architecture-
- LicenseApache 2.0
- UpdatedMar 2026
Жиі қойылатын сұрақтар
Vosk - Alpha Cephei- нің сөйлеуден мәтінге аудару үлгісі. STT.ai- дің Vosk- ді графикалық процессордың инфрақұрылымы қолдайды, сондықтан оны өзіңіздің жабдықтарыңызды қоспай- ақ қолдана аласыз - аудио не видеоны жүктеп, үлгіні таңдау құралынан Vosk- ді таңдаңыз.
Стандартты тексерулерде Vosk шамамен 12.0% сөз қателігіне ие. Тілдегі қателіктердің шынайы дәлдігі дыбыс сапасына, акцентіне және тіліне байланысты; шулы немесе акцентті жазбалар үшін WER бірнеше пайызға жоғары болады.
Vosk STT.ai-ның тегін деңгейінде жұмыс істейді — әрбір келуші айына 600 минутты тегін алады. Ақылы жоспарлар файлға қысқа шектеулер, жеке транскрипциялар және артықшылық кезекті қосады.
Vosk Apache 2.0 ашық-көздік лицензиясымен шығарылған. Сіз Vosk-ді өзіңіздің жабдықтарыңызда немесе біздің хостинг нұсқамызды қолданып, өзіңізде орната аласыз - екеуі де коммерциялық мақсатта қолданылады.
Vosk 20 тілдерді қолдайды. Аудио файлдардың көпшілігі үшін тіл автоматты түрде анықталады; бірақ, дәлдігін арттыру үшін оны қолмен де келтіруге болады.
Vosk аудионы біздің графикалық процессорларда 100.0x жылдамдықпен өңдейді. 1 сағаттық аудио файлды өңдеу 1 минуттан аз уақытты алады; ұзақ файлдар кезекке тұрып, орындалғанда эл. пошта арқылы хабарланады.
Vosk- нің 50M параметрлері бар. Үлкен модельдер нақтылығы жоғары, бірақ баяу; STT.ai- дің графикалық процессорында Vosk бар, сондықтан параметрлер саны клиенттік жағының жылдамдығына әсер етпейді.
Vosk STT.ai қолдайтын барлық пішімдерді қабылдайды — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI және басқалары. Шығыс TXT, SRT, VTT, DOCX, JSON немесе PDF.
Иә. Дикторлар тізімі әрбір транскрипция үшін Vosk- мен бірге орындалады - әрбір дыбыс шығарушы белгіленеді, содан кейін редакторда қайта атауға болады.
Иә. Vosk біздің басқару ортамызда орындалады — аудио әдетті түрде өңделеді және өшіріледі, және ешқашан да рұқсатсыз оқыту үшін қолданылмайды. Pro жоспары клиенттік тараптан тыныштықтағы транскрипттерді шифрлауды қосады.
compare-stt құралын пайдаланып, Vosk-ді басқа қолдау көрсетілетін модельдермен салыстырып көріңіз. WER, сегменттер саны, динамиктердің жарлықтары және сенімділік көрсеткіштері қатар көрсетіледі. Vosk мен Whisper Large V3 салыстыруы жиі қолданылады.
Иә. /v1/transcribe аяқтау нүктесіндегі модель параметрі ретінде "vosk" дегенді келтіріңіз. Python және Node.js SDK- лары Vosk мысалдарды қамтиды. API- ның тегін деңгейі 100 минут/ ай.
Иә. Vosk Apache 2.0 лицензиясымен шыққандықтан, оны өзіңіз хост ете аласыз. STT.ai ашық көздер бетінде жобаның репозиториясы мен салмағы көрсетілген. Өндірістік топтардың көбі біздің хост нұсқамызды GPU сатып алу, модельдерді алмастыру және операцияларды өткізіп жіберу үшін пайдаланады.