Доклад " Bugg " / " Особенности запроса "

Переписка Vosk

Name: Vosk
Author: Alpha Cephei

Работа с общедоступным аудио- и видеозаписями не поддерживается.

Модернизация в целях повышения квалификации

Частный стенограмма

Говорить с стенограммой

Разблокировать с Про →

Сбрасывать файл здесь или щёлкнуть для просмотра

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — до 2GB

Загрузка нескольких файлов с про

Модернизация в целях повышения квалификации

Частный стенограмма

Говорить с стенограммой

Разблокировать с Про →

Модернизация в целях повышения квалификации

В реальном времени речь в текст. AI автоматически корректирует, как вы говорите — точность улучшается с помощью более длинной речи.

Сначала проверьте микрофон.

10 мин./сутки 600 мин. без регистрации Нет кредитной карты Зашифровано

Запишитесь бесплатно. →

12.0%

WER

Знание языков

100.0x

Скорость

Apache 2.0

Лицензия

О том, что Vosk

Vosk — офлайн-инструмент распознавания речи, который работает без подключения к Интернету. Он поддерживает 20+ языков с компактными моделями, которые могут работать на мобильных устройствах, Raspberry Pi и любой платформе. Построен на архитектурах Kaldi и Zipformer.

Языки, поддерживаемые Vosk

Английский

Испанский

Французский

Немецкий

Китайский

Японский

Корейский

Португальский

Арабский

Хинди

Русский

Итальянский

Нидерландский

Турецкий

Польский

Шведский

Индонезийский

Вьетнамский

Чешский

Греческий

Модель

ПоставщикAlpha Cephei
Архитектура-
ЛицензияApache 2.0
ОбновленныеMar 2026

Смежные модели

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Часто задаваемые вопросы

Vosk — это речевая модель на Alpha Cephei. STT.ai носит Vosk на нашей инфраструктуре GPU, так что вы можете использовать ее без обеспечения собственного оборудования — загружать аудио- или видео и выбирать Vosk из сборщика модели.

При стандартных контрольных параметрах Vosk достигает примерно 12.0% скорости ошибок в Word. Точность в реальном мире зависит от качества звука, акцента и языка; для шумных или заостренных записей ожидается, что на несколько процентных пунктов выше WER.

Vosk работает на бесплатной ярусе STT.ai — каждый посетитель получает 600 минут, чтобы начать бесплатно.

Vosk выпущено на Apache 2.0 год, разрешительная лицензия с открытым исходным кодом. Вы можете самостоятельно принять Vosk на вашем собственном оборудовании или использовать нашу приёмную версию — оба они могут быть использованы на коммерческой основе.

Vosk поддерживает 20 язык. Автообнаружение выбирает правильный язык для большинства звуков; вы также можете указать его вручную для небольшого лифта с точностью.

Vosk обрабатывает аудио примерно 100.0x в режиме реального времени на наших GPU. 1-часовой аудио файл заканчивается меньше чем за 1 минуты; более длинный список файлов и уведомление по электронной почте, когда он будет сделан.

Vosk имеет параметры 50M. Большие модели, как правило, более точны, но медленнее; STT.ai носит Vosk на GPU, так что число параметров не влияет на производительность вашего клиента.

Vosk принимает каждый формат STT.ai поддержки — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI и другие.

Да, диааризация спикера проводится вместе с Vosk за каждую транскрипцию — каждый оратор помечен ярлыком, и после этого вы можете переименовать их в редактора.

Да. Vosk прогонов в нашей регулируемой среде — аудио обрабатывается и удаляется по умолчанию и никогда не используется для обучения без прямого выбора. Про-планы добавляют шифрование клиентом для расшифровки стенограмм.

Используйте инструмент для сравнения с Vosk против любой другой поддерживаемой модели на одном и том же аудио — вы увидите WER, число сегментов, ярлыки громкостей и оценки достоверности одновременно. Сопоставление Vosk vs Whisper Крупный V3 — наиболее частое сравнение.

Да. Указать "vosk" в качестве параметра модели на конечных точках /v1/tranarip. Python и Node.js SDKs включают Vosk примеры. Свободный API уровень включает 100 минут в месяц.

Да, так как Vosk имеет Apache 2.0-лицензию, вы можете самостоятельно завести его. На странице с открытым исходным кодом STT.ai перечисляются репо и весы проекта. Большинство производственных команд используют нашу хост-версия, чтобы пропустить закупки GPU, свопы моделей и операции.

Переписка Vosk

О том, что Vosk

Языки, поддерживаемые Vosk

Модель

Смежные модели

Часто задаваемые вопросы

Что такое Vosk?

Насколько точно Vosk?

Vosk можно использовать?

Какие лицензии используют Vosk?

Сколько языков поддерживает Vosk?

Как быстро Vosk?

Насколько большая модель Vosk?

Какие аудиоформаты могут писать Vosk?

Vosk обнаруживает несколько колонок?

Мои данные закрыты при использовании Vosk?

Как Vosk сравниваются с другими моделями STT?

Могу я использовать Vosk через API?

Могу я запустить Vosk на своем собственном сервере?