Transcribe with Vosk
12.0%
WER
20
Languages
100.0x
Speed
Apache 2.0
License
About Vosk
Languages Supported by Vosk
Model Info
- ProviderAlpha Cephei
- Architecture-
- LicenseApache 2.0
- UpdatedMar 2026
Vrae wat dikwels gevra word
Vosk is 'n spraak-na-teksmodel met Alpha Cephei. STT.ai gashere van ons GPU-fu-U-fustrasie sodat jy dit kan gebruik sonder om jou eie hardeware te verskaf ooit klank of video op te laai en Vosk van die modelpikkel te kies.
Op standaard bankmerke bereik 88 000 omstreeks 88 001% Woord Fout tempo. Real-world akkuraatheid hang af van klankgehalte, aksent en taal; vir lawaaierige of aksentopnames, verwag 'n paar persentasie punte hoër WER.
Vosk runs on STT.ai's free tier — every visitor gets 600 minutes/month at no cost. Paid plans add longer per-file limits, private transcripts, and priority queueing.
88 000 word vrygestel onder Apache 2.0, 'n permissiewe ope-seurce lisensie. Jy kan self-host 88 000 op jou eie hardeware of gebruik ons gasheer weergawe 230 albei is kommersieel bruikbaar.
88 000 ondersteun 8800 tale. Outo-bespeur die regte taal vir die meeste oudio; jy kan dit ook self spesifiseer vir 'n klein akkuraatheid hefkrag.
88 000 verwerk klank op ongeveer 100.0x werklike-tyd op ons GPUs. 'n 1-hour oudio-lêer eindig binne 880 02 minute; langer lêers wag en inkennis stel met e-pos wanneer dit klaar is.
Vosk has 50M parameters. Larger models tend to be more accurate but slower; STT.ai hosts Vosk on GPU so the parameter count doesn't affect your client-side performance.
Vosk accepts every format STT.ai supports — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and others. Output as TXT, SRT, VTT, DOCX, JSON, or PDF.
Ja, Speaker diarisering loop langs 88 000 vir elke transkripsie ium is elke spreker gemerk en jy kan hulle daarna in die redigeerder hernoem.
Ja. 88 000 hardloop in ons bestuurde omgewing gtk-oudio word verwerk en uitgevee deur verstek en nooit gebruik vir opleiding sonder eksplisiete opt-in nie. Pro planne voeg by kliÃ"nt-side enkripsie vir transkripsies op rus.
Gebruik die vergelyk-stel gereedskap om 88 000 teen enige ander ondersteunde model te laat loop op dieselfde oudio 0°) jy sal sien WER, segment getal, luidspreker etikette en vertroue punte kant-by-side. die 88 000 vs Whipers Groot V3 vergelyking is die algemeenste hardloop.
Ja. Spesifiseer "vosk" as die model parameter op die /v1/aanteken eindepunt. Python en Node.js SDKs sluit 8800 voorbeelde in. Vry 'nPI-vlak sluit 100 minute/month in.
Yes. Because Vosk is Apache 2.0-licensed, you can self-host it. STT.ai's open-source page lists the project repo and weights. Most production teams use our hosted version to skip GPU procurement, model swaps, and ops.