Rapporteer bug / feature request

Transcriberen met Vosk

Name: Vosk
Author: Alpha Cephei

Werkt met publiek beschikbare audio & video. DRM-beschermde inhoud wordt niet ondersteund.

Upgrade voor verbeterd

Privé-afschrift

Chat met transcript

Ontgrendelen met Pro →

Bestand hier neerzetten of klik om te bladeren

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM tot 2GB

Batch meerdere bestanden uploaden met Pro

Upgrade voor verbeterd

Privé-afschrift

Chat met transcript

Ontgrendelen met Pro →

Upgrade voor verbeterd

Real-time spraak op tekst. AI auto-correcties als u spreekt.. de nauwkeurigheid verbetert met langere spraak.

Test eerst je microfoon

10 vrij min/dag 600 min vrij met aanmelding Geen creditcard Versleuteld

Gratis aanmelden →

12.0%

WER

Talen

100.0x

Snelheid

Apache 2.0

Licentie

Info Vosk

Vosk is een offline spraakherkenningstoolkit die werkt zonder internetverbinding. Het ondersteunt 20+ talen met compacte modellen die kunnen draaien op mobiele apparaten, Raspberry Pi, en elk platform. Gebouwd op Kaldi en Zipformer architecturen.

Talen Ondersteund door Vosk

Engels

Spaans

Frans

Duits

Chinees

Japans

Koreaans

Portugees

Arabisch

Hindi

Russisch

Italiaans

Nederlands

Turks

Pools

Zweeds

Indonesisch

Vietnamees

Tsjechisch

Grieks

Modelinformatie

AanbiederAlpha Cephei
Architectuur-
LicentieApache 2.0
BijgewerktMar 2026

Gerelateerde modellen

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Veelgestelde vragen

Vosk is een speech-to-text model van Alpha Cephei. STT.ai hosts Vosk op onze GPU-infrastructuur, zodat u het kunt gebruiken zonder het voorzien van uw eigen hardware te uploaden audio of video en kies Vosk uit de model picker.

Op standaard benchmarks bereikt Vosk ongeveer 12.0% Word Error Rate. Real-world nauwkeurigheid is afhankelijk van audiokwaliteit, accent en taal; voor lawaaierige of geaccentueerde opnames, verwachten een paar procentpunten hoger WER.

Vosk draait op STT.ai gratis tier.. elke bezoeker krijgt 600 minuten om te beginnen zonder kosten. Betaalde plannen toevoegen van langere per-bestand grenzen, privé transcripten, en prioriteit wachtrij.

Vosk wordt vrijgegeven onder Apache 2.0, een permissieve open-source licentie. U kunt zelf-host Vosk op uw eigen hardware of gebruik maken van onze gehoste versie zijn beide commercieel bruikbaar.

Vosk ondersteunt 20 talen. Autodetectie kiest de juiste taal voor de meeste audio; u kunt het ook handmatig specificeren voor een kleine nauwkeurigheid lift.

Vosk verwerkt audio op ongeveer 100.0x real-time op onze GPU's. Een 1-uurs audiobestand eindigt in minder dan 1 minuten; langere files wachtrij en melding per e-mail wanneer gedaan.

Vosk heeft 50M parameters. Grotere modellen hebben de neiging om nauwkeuriger maar langzamer te zijn; STT.ai hosts Vosk op GPU zodat de parametertelling geen invloed heeft op de prestaties van uw client-side.

Vosk accepteert elk formaat dat STT.ai ondersteunt. MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, en anderen. Output als TXT, SRT, VTT, DOCX, JSON, of PDF.

Ja. Speaker diarization loopt naast Vosk voor elke transcriptie • elke speaker is gelabeld en je kunt ze hernoemen in de editor achteraf.

Ja. Vosk wordt uitgevoerd in onze beheerde omgeving audio wordt verwerkt en verwijderd standaard en nooit gebruikt voor training zonder expliciete opt-in. Pro plannen toevoegen client-side encryptie voor transcripten in rust.

Gebruik de compare-stt tool om Vosk uit te voeren tegen elk ander ondersteund model op dezelfde audio, zie je WER, segment count, speaker labels, en vertrouwen scoort side-by-side. De Vosk vs Whisper Large V3 vergelijking is de meest voorkomende run.

Ja. Geef "vosk" op als de modelparameter op het /v1/transcribe eindpunt. Python en Node.js SDK's bevatten Vosk voorbeelden. Gratis API tier bevat 100 minuten/maand.

Ja. Omdat Vosk is Apache 2.0-licentie, kunt u zelf-hosten. STT.ai open-source pagina bevat de project repo en gewichten. De meeste productieteams gebruiken onze gehoste versie om GPU inkoop over te slaan, model swaps, en ops.

Transcriberen met Vosk

Info Vosk

Talen Ondersteund door Vosk

Modelinformatie

Gerelateerde modellen

Veelgestelde vragen

Wat is Vosk?

Hoe nauwkeurig is Vosk?

Is Vosk gratis te gebruiken?

Welke licentie gebruikt Vosk?

Hoeveel talen ondersteunen Vosk?

Hoe snel is Vosk?

Hoe groot is het Vosk model?

Welke audioformaten kunnen Vosk transcriberen?

Detecteert Vosk meerdere luidsprekers?

Zijn mijn gegevens privé wanneer ik Vosk gebruik?

Hoe vergelijkt Vosk met andere STT-modellen?

Kan ik Vosk gebruiken via de API?

Kan ik Vosk draaien op mijn eigen server?