Transcribe with Vosk
12.0%
WER
20
Languages
100.0x
Speed
Apache 2.0
License
About Vosk
Languages Supported by Vosk
Model Info
- ProviderAlpha Cephei
- Architecture-
- LicenseApache 2.0
- UpdatedMar 2026
Часті запитання
Vosk - це модель тексту мовлення від 8 8002. STT.ai вузлів - Vosk на нашій інфраструктурі GPU, отже ви можете використовувати її без забезпечення власного апаратного завантаження звуку або відео і вибрати Vosk з інструменту вибору моделі.
За стандартними полями Vosk досягає приблизно 12.0% Частота помилок за словами. Точність реального світу залежить від якості звуку, акценту та мови; для галасливих або акцентованих записів очікується на декількох відсоткових пунктах вищого WER.
Vosk працює на свободній краватці STT.ai - кожен відвідувач отримує 600 хвилин/ місяців за будь- яку ціну. Плани паудів додають більше за обмеження файлів, приватні архіви і черги пріоритетів.
Vosk is released under Apache 2.0, a permissive open-source license. You can self-host Vosk on your own hardware or use our hosted version — both are commercially usable.
Vosk підтримують 20 мови. Автовиявлення обирає правильну мову для більшості звукових файлів; ви також можете вказати її вручну для невеличкого підйому точності.
Vosk оброблює звукові дані у режимі реального часу близько 100.0x у нашому GPU. Одногодинний звуковий файл завершується у менш ніж 8 8002 хвилини; довші файли у черзі і сповіщення електронною поштою.
Vosk має 8882 параметри. Великі моделі зазвичай є точнішими, але повільнішими; STT.ai вузлів - Vosk на GPU, отже кількість параметрів не впливає на швидкодію вашого клієнта.
Vosk приймає кожен формат STT.ai підтримує MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI та інші. Вивід у вигляді TXT, SRT, VTT, DOCX, JSON або PDF.
Так. diamer diaarization працює поряд Vosk на кожен запис, кожен з промов буде позначено, і ви зможете перейменувати їх у редакторі після цього.
Yes. Vosk runs in our managed environment — audio is processed and deleted by default and never used for training without explicit opt-in. Pro plans add client-side encryption for transcripts at rest.
Скористайтеся інструментом порівняння- stest, щоб запустити Vosk у порівнянні з будь- якою іншою моделлю, що підтримується, на одному і тому ж звуковому каналі, ви побачите WER, кількість сегментів, надписи промовців, а також результати довіри збоку. Порівняння Vosk проти Wisper Великий V3 є найбільш поширеним.
Так. Вкажіть " vosk " як параметр моделі у теці / v1/ trancess кінцевій точці. У назвах Python і вузла. js SDKs містяться Vosk приклади. У вільний інтерфейс API міститься 100 хвилин/ місяців.
Так. Оскільки Vosk має 8882- ліцензію, ви можете виконати її. STT.ai - на сторінці з відкритим кодом наведено список експропріаторів та ваг. Більшість команд з виробництва використовують нашу власницьку версію для того, щоб пропустити закупівлю на GPU, моделі свопінгу і ops.