Transcribe with Vosk

Funktionéiert mat ëffentlech verfügbaren Audio- a Videodateien. DRM-geschützte Inhalt gëtt net ënnerstëtzt.

Upgrade fir erweidert
Private transcript
Chat mat Transkriptioun
D'Spill ass gratis. →
Datei heihin zéien oder klickt fir ze sichen
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — bis zu 2 GB
Upgrade fir erweidert
Private transcript
Chat mat Transkriptioun
D'Spill ass gratis. →
Upgrade fir erweidert
Opnahme: 0:00
Echtzäit (Lëtzebuergesch)
Verbessert (Lëtzebuergesch)
24h, Lëtzebuerger Journal · Anmelden Audio · Pro fir privat Links

Echtzäit-Sprooch-zu-Text. AI korrigéiert automatesch wann Dir schwätzt - d'Genauegkeet verbessert sech mat méi laanger Sprooch.

Testen Sie zuerst Ihren Mikrofon
❤️ STT.ai? Erzielt et Äre Frënn!
Dir hutt Är gratis Transkriptiounen benotzt

Et gëtt 600.000 bis 1.000.000 Leit, déi sech fir d'Reform vun der Verfassung engagéieren.

10 gratis Minutten/Dag 600 Joer Lëtzebuerger Literatur Kreditkaart Verschlësselt
Gratis anmelden →
12.0%
WER
20
Languages
100.0x
Speed
Apache 2.0
License

About Vosk

Häufig gestallte Froen

D'Nummer Vosk ass e Sprooch-zu-Text-Modell vum Alpha Cephei. STT.ai hostet Vosk op eiser GPU-Infrastruktur, sou datt Dir et benotze kënnt ouni Är eege Hardware ze bidden - Audio oder Video erofzelueden an Vosk aus der Modellauswiel erauszehuelen.

D'Zuel vun de Sproochen, déi an der Welt geschwat ginn, ass ronn 880 Milliounen, an déi meescht vun hinnen hunn eng Sprooch als Mammesprooch.

Vosk runs on STT.ai's free tier — every visitor gets 600 minutes/month at no cost. Paid plans add longer per-file limits, private transcripts, and priority queueing.

Vosk ass ënner der Apache 2.0, enger permissiver Open-Source-Lizenz verëffentlecht ginn. Dir kënnt Vosk op Ärer eegene Hardware hosten oder eis gehostete Versioun benotzen - béid sinn kommerziell benotzt.

Vosk ënnerstëtzt 20 Sproochen. D'Auto-Erkennung wielt d'richtig Sprooch fir déi meescht Audio; Dir kënnt et och manuell uginn fir eng kleng Präzisiounssteigerung.

Vosk veraarbecht Audio mat ongeféier 100.0x Echtzäit op eise GPUen. Eng 1 Stonn laang Audiodatei ass a manner wéi 1 Minutten ofgeschloss; méi laang Dateien ginn an d'Warteschlange gesat an no der Fertigstellung per E-Mail informéiert.

Vosk huet 50M Parameter. Grouss Modeller sinn dacks méi genee, awer méi lues; STT.ai huet Vosk op der GPU, sou datt d'Zuel vun de Parameteren Är Clientsleeschtung net beaflosst.

Vosk akzeptéiert all Formater déi STT.ai ënnerstëtzt — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, an aner. Ausgab als TXT, SRT, VTT, DOCX, JSON oder PDF.

D'Sprooch ass ronn 800.000 Leit bekannt, déi an der ganzer Welt geschwat ginn, an déi meescht vun hinnen an der Regioun liewen.

Ja. Vosk leeft an eiser verwalteter Ëmwelt — Audio gëtt standardméisseg veraarbecht a geléist a gëtt ni fir Training benotzt ouni explizit Opt-in. Pro Pläng addéieren Client-säiteg Verschlësselung fir Transkriptiounen am Ruhezustand.

D'Vergleiche-stt-Tool gëtt benotzt fir Vosk mat all anere Modeller ze vergläichen, déi op deem selwechten Audiosystem ënnerstëtzt ginn. Dobäi gesi mir WER, Segment-Zuel, Lautsprecher-Label an Zuverlässegkeetswäerter netzwierklech. De Verglach Vosk vs Whisper Large V3 gëtt am meeschte benotzt.

Ja. Gebt "vosk" als Modellparameter op dem /v1/transcribe Endpunkt un. Python an Node.js SDKs enthalen Vosk Beispiller. D'gratis API-Tier enthält 100 Minutten/Mount.

Ja. Well Vosk Apache 2.0-lizenzéiert ass, kënnt Dir et selwer hosten. D'Open-Source-Säit vun STT.ai lëscht de Projet-Repo an d'Gewiicht op. D'Meiste Produktiounsteams benotzen eis gehostete Versioun fir GPU-Beschaffung, Modell-Swaps an Ops ze iwwerhuelen.