Transcribe with Vosk

Ради са јавно доступним аудио & видеом. Садржај заштићен ДРМ није подржан.

Надоградња за побољшане
Private transcript
Ћаскање са транскриптом
Откључај помоћу проф. →
Спусти фајл овде или кликните да прегледате
МП3, ВАВ, М4А, ФЛАЦ, МП4, МКВ, МОВ, ВебМ — до 2ГБ
Надоградња за побољшане
Private transcript
Ћаскање са транскриптом
Откључај помоћу проф. →
Надоградња за побољшане
Снимање: 0:00
реално вр› ијеме Воск (инстант)
побољшано Вхиспер (прецизно)
Јавне везе: 24х, само текст · Упиши се за 7d + аудио · Проф. за приватне везе

Говор у реално време за текст. Ауто- исправља док говорите — тачност се побољшава са дужем говором.

Прво тестирај микрофон.
❤️ Love STT.ai? Tell your friends!
Ви сте користили своје бесплатне транскрипције

Пријавите се бесплатно да добијете 600 минута месечно, или надоградите за неограничене транскрипције.

10 слободног мин/дан 600 минута бесплатно са пријавом Нема кредитне картице шифровано
Упиши се бесплатно →
12.0%
WER
20
Languages
100.0x
Speed
Apache 2.0
License

About Vosk

Често постављана питања

Vosk је модел говор-текст од Alpha Cephei. STT.ai домаћина Vosk на нашој ГПУ инфраструктури тако да га можете користити без обезбеђења сопственог хардвера — слање аудио или видео и одабирање Vosk из модела берача.

На стандардним стандардним стандардима, Vosk постиже око 12.0% процена грешака речи. Прецизност реалног света зависи од квалитета звука, акцента и језика; за бучне или акцентиране снимке, очекује се неколико процената вишег ВЕР‐ а.

Vosk ради на STT.ai-овом слободном нивоу — сваки посетилац добија 600 минута месечно без трошкова. Плаћени планови додају више граница по фајлу, приватне транскрипте и приоритетне редоследе.

Vosk је ослобођено под Apache 2.0, попустљива дозвола отвореног извора, можете да водите Vosk на сопственом хардверу или да користите нашу верзију домаћина — оба су комерцијално коришћена.

Vosk подржава 20 језике. Аутоматско откривање изабира прави језик за већину звука; такође га ручно можете задати за мали лифт тачности.

Vosk процесира звук на око 100.0x реално време на нашим ГПУ‐ овима. Један сат аудио фајла завршава испод 8802 минута; дуже фајлове у реду и обавештење е‐ поштом.

Vosk има 8802 параметра. Већи модели обично су прецизнији, али спорији; STT.ai домаћина Vosk на ГПУ, тако да број параметара не утиче на перформансе вашег клијента.

Vosk прихвата сваки формат STT.ai подршке — МП3, ВАВ, М4А, ФЛАЦ, ОГГ, МП4, МКВ, МОВ, ВебМ, АВИ и остали. Излаз као ТХТ, СРТ, ВТТ, ДОКС, ЈСОН или ПДФ.

Дијаризација звучника ради поред Vosk за сваку транскрипцију — сваки звучник је означен и можете да их преименујете у уређивачу после тога.

Да. Vosk ради у нашем управљеном окружењу — аудио се обрађује и обрише подразум› ијевано и никада се не користи за обуку без експлицитне опције. Про планови додају шифровање са стране клијента за транскрипте у миру.

Користите алатку за упоређивање да покренете Vosk против било ког другог подржаног модела на истом звуку — видећете ВЕР, број сегмента, налепнице звучника и поверљиве резултате са стране поред. Најчешће је поређење Vosk против Whisper Велики В3.

Да. Задајте „ vosk “ као параметар модела на крајњој тачки /v1/transcribed. Питон и Node.js СДК укључују Vosk примера. Слободни АПИ низ укључује 100 минута/месечно.

Да, зато што је Vosk 8802-лицензиран, можете да га водите. STT.ai отворене странице набраја репо и тежине пројекта. Већина продуцентских тимова користи нашу домаћинску верзију да прескочите ГПУ набавке, замене модела и операције.