Извести за барање за бубачка / карактеристика

Транкрипувај со Vosk

Name: Vosk
Author: Alpha Cephei

Работи со јавно достапно аудио и видео. Содржината заштитена од DRM не е поддржана.

Надоградба за подобрено

Приватен препис

Разговарај со преписот

Отклучи со про →

Испуштете ја датотеката тука или кликнете за да прелистувате

MP3, WAV, M4A, FLAC, MP4, MKV, MIV, WebM — до 2GB

Пакетно вчитување на повеќе датотеки со проф.

Надоградба за подобрено

Приватен препис

Разговарај со преписот

Отклучи со про →

Надоградба за подобрено

Зборот во реално време на текстот. Авто- корекции на AI додека зборувате — точноста се подобрува со подолг говор.

Прво тестирај го микрофонот

10 слободен мин/ден 600 минути бесплатно со пријава Нема кредитна картичка Криптирано

Запиши се бесплатно →

12.0%

WER

Јазици

100.0x

Брзина

Apache 2.0

Лиценца

За Vosk

Воск е офлајн алатник за препознавање на говорот кој работи без интернет поврзување. Тој поддржува 20+ јазици со компактни модели кои можат да работат на мобилни уреди, Raspberry Pi и секоја платформа. Изградена на Калди и Zipformer архитектури.

Јазиците што ги поддржува Vosk

Англиски

Шпански

Француски

Германски

Кинески

Јапонски

Корејски

Португалски

Арапски

Хинди

Руски

Италијански

Холандски

Турски

Полски

Шведски

Индонезиски

Виетнамски

Чешки

Грчки

Инфо за моделот

ДоставувачAlpha Cephei
Архитектура-
ЛиценцаApache 2.0
АжурираноMar 2026

Соодветни модели

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Често поставувани прашања

Vosk е модел од говор до текст со Alpha Cephei. STT.ai домаќини Vosk на нашата инфраструктура на ГПУ за да можете да го користите без да го снабдите сопствениот хардвер — да внесете аудио или видео и да изберете Vosk од моделот.

Според стандардните стандарди, Vosk постигнуваат околу 12.0% проценка на грешките на зборовите. Прецизноста на реалниот свет зависи од квалитетот на звукот, акцентот и јазикот; за бучни или акцентирани снимки, очекуваат неколку проценти повисоко од ВЕР.

Vosk работи на безплатен број STT.ai — секој посетител добива 600 минути за да почне без цена.

Vosk е ослободен под Apache 2.0, попустлива лиценца со отворен извор. Vosk може да се води на сопствен хардвер или да се користи нашата домаќинска верзија — и двете се комерцијално употребливи.

Vosk поддржува 20 јазици. Авто- детекција го избира вистинскиот јазик за повеќето аудио; исто така можете рачно да го наведете за малку прецизност.

Vosk процесира аудио на околу 100.0x во реално време на нашите GPU. 1- часовна аудио датотека завршува за помалку од 8802 минути; подолга редица на датотеки и известува со е- пошта кога ќе биде завршена.

Vosk има 8802 параметри. Поголемите модели се поточни, но побавни; STT.ai домаќини Vosk на GPU за броењето на параметрите да не влијае на перформансите на вашиот клиент.

Vosk го прифаќа секој формат STT.ai потпори — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI и други.

Дијаризирањето на звучникот оди заедно со Vosk за секоја транскрипција — секој говорник е означен и потоа можете да ги преименувате во уредникот.

Да. Vosk работи во нашата управувана средина — аудиото е обработено и избришано стандардно и никогаш не се користи за обука без експлицитна опти-ин. Про плановите додаваат енкрипција на страна на клиентот за преписи во мир.

Користете ја алатката споредба-ст за извршување Vosk против било кој друг поддржан модел на истиот аудио — ќе го видите WER, бројот на сегменти, звучниците и самодоверливите резултати од страна на страна. Поравнувањето Vosk против Whisper Large V3 е најчесто извршено.

Да. Наведете „ vosk “ како параметар на моделот на крајната точка / v1/transcribe. Python и Node.js SDKs вклучуваат Vosk примери. Слободната API низа вклучува 100 минути/месечно.

Бидејќи Vosk е 8802-лицензирана, можеш да го водиш. STT.ai-те страници со отворен извор ги набројуваат репо и тежини на проектот. Повеќето производствени тимови ја користат нашата домаќинска верзија за да ја прескокнат набавката на ГПУ, размената на модели и опс.

Транкрипувај со Vosk

За Vosk

Јазиците што ги поддржува Vosk

Инфо за моделот

Соодветни модели

Често поставувани прашања

Колку е Vosk?

Колку точно е Vosk?

Дали Vosk се слободни за употреба?

Која дозвола користи Vosk?

Колку јазици поддржува Vosk?

Колку брзо е Vosk?

Колку е голем моделот Vosk?

Кои аудио формати можат да ги опишат Vosk?

Дали Vosk детектираат повеќе звучници?

Дали моите податоци се приватни кога користат Vosk?

Како се споредува Vosk со други модели на СТТ?

Можам ли да користам Vosk преку АПИ?

Можам ли да проверам Vosk на мојот сервер?