Transcribe with Vosk
12.0%
WER
20
Languages
100.0x
Speed
Apache 2.0
License
About Vosk
Languages Supported by Vosk
Model Info
- ProviderAlpha Cephei
- Architecture-
- LicenseApache 2.0
- UpdatedMar 2026
Frequently Asked Questions - FAQ
STT.ai hoste Vosk sur notre infrastructure GPU afin que vous puissiez l'utiliser sans provisionner votre propre hardware — téléchargez de l'audio ou du vidéo et choisissez Vosk dans le sélecteur de modèles.
La précision dans le monde réel dépend de la qualité audio, de l'accent et de la langue; pour les enregistrements bruyants ou accentués, attendez-vous à quelques points de pourcentage plus élevés WER.
Vosk e na STT.ai's free tier — every visitor gets 600 minutes/month without cost.Paid plans add longer per-file limits, private transcripts, and priority queuing.
Vosk é libéré anba Apache 2.0, yon lisans libète pou moun ka fè li-hoste so-you-même Vosk sou ou-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-you-yo
Auto-detection choisit la bonne langue pour la plupart des audio; vous pouvez aussi la spécifier manuellement pour un petit coup de pouce à la précision.
Un fichier audio d'une heure se termine en moins de 1 minutes; les fichiers plus longs sont mis en file d'attente et notifiés par email quand ils sont terminés.
Les modèles plus grands ont tendance à être plus précis mais plus lents; STT.ai héberge Vosk sur GPU donc le nombre de paramètres n'affecte pas votre performance côté client.
Vosk accepte tous les formats que supporte STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, et autres.Resultat comme TXT, SRT, VTT, DOCX, JSON, ou PDF.
Diarizason ya songa ya songa ya songa ikole na Vosk kwa kila transkripsiyo — kila songa ya songa ilabelwa na munaweza kuzibadilisha majina katika editor baadaye.
Vosk é executado em nosso ambiente gerenciado — o áudio é processado e apagado por padrão e nunca é usado para treinamento sem opt-in explícito. Os planos Pro adicionam criptografia do lado do cliente para transcrições em repouso.
Use the compare-stt tool to run Vosk against any other supported model on the same audio — you'll see WER, segment count, speaker labels, and confidence scores side-by-side.Use the compare-stt tool to run Vosk against any other supported model on the same audio — you'll see WER, segment count, speaker labels, and confidence scores side-by-side.
Specify "vosk" as the model parameter on the /v1/transcribe endpoint. Python and Node.js SDKs include Vosk examples. Free API tier includes 100 minutes/month.
Ya. Vosk e na lisensi Apache 2.0, e ka hosted na we. STT.ai's open-source page lists the project repo and weights. La plupart des équipes de production utilisent notre version hosted pour sauter l'acquisition de GPU, les échanges de modèles et les ops.