Bug / Feature Request mellen

Transkriptioun SenseVoice

Name: SenseVoice
Author: FunAudioLLM

Funktionéiert mat ëffentlech verfügbaren Audio- a Videodateien. DRM-geschützte Inhalt gëtt net ënnerstëtzt.

Upgrade fir erweidert

Privattranskriptioun

Chat mat Transkriptioun

D'Spill ass gratis. →

Datei heihin zéien oder klickt fir ze sichen

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — bis zu 2 GB

Batch-Upload vu méi Dateien Pro

Upgrade fir erweidert

Privattranskriptioun

Chat mat Transkriptioun

D'Spill ass gratis. →

Upgrade fir erweidert

Echtzäit-Sprooch-zu-Text. AI korrigéiert automatesch wann Dir schwätzt - d'Genauegkeet verbessert sech mat méi laanger Sprooch.

Testen Sie zuerst Ihren Mikrofon

10 gratis Minutten/Dag 600 Joer Lëtzebuerger Literatur Kreditkaart Verschlësselt

Gratis anmelden →

5.5%

WER

Sproochen

50.0x

Geschwindegkeet

MIT

Lizenz

Iwwer SenseVoice

SenseVoice ass e Sproochmodell vun FunAudioLLM, dat méi wéi Transkriptioun ass. Et ënnerstëtzt iwwer 50 Sproochen an enthält Fäegkeeten fir Emotiounen ze erkenntnen, Audioereignisser ze erkenntnen an d'Normaliséierung vun ëmgekehrtem Text an engem eenzegen Modell.

Sproochen SenseVoice

Englesch

Spuenesch

Franséisch

Däitsch

Chinesesch

Japanesch

Koreanesch

Portugisesch

Arabesch

Hindi

Russesch

Italienesch

Hollännesch

Tierkesch

Polnesch

Schwedesch

Indonesesch

Thailännesch

Vietnamesesch

Tschechesch

Griichesch

Rumänesch

Ungaresch

Hebräesch

Dänesch

Finnesch

Norwegesch

Ukrainesch

Malaiesch

Bengalesch

Modellinformatioun

ProviderFunAudioLLM
Architektur-
LizenzMIT
AktualiséiertMar 2026

Häufig gestallte Froen

D'Nummer SenseVoice ass e Sprooch-zu-Text-Modell vum FunAudioLLM. STT.ai hostet SenseVoice op eiser GPU-Infrastruktur, sou datt Dir et benotze kënnt ouni Är eege Hardware ze bidden - Audio oder Video erofzelueden an SenseVoice aus der Modellauswiel erauszehuelen.

D'Zuel vun de Sproochen, déi an der Welt geschwat ginn, ass ronn 880 Milliounen, an déi meescht vun hinnen hunn eng Sprooch als Mammesprooch.

SenseVoice runs on STT.ai's free tier — every visitor gets 600 minutes/month at no cost. Paid plans add longer per-file limits, private transcripts, and priority queueing.

SenseVoice ass ënner der MIT, enger permissiver Open-Source-Lizenz verëffentlecht ginn. Dir kënnt SenseVoice op Ärer eegene Hardware hosten oder eis gehostete Versioun benotzen - béid sinn kommerziell benotzt.

SenseVoice ënnerstëtzt 50 Sproochen. D'Auto-Erkennung wielt d'richtig Sprooch fir déi meescht Audio; Dir kënnt et och manuell uginn fir eng kleng Präzisiounssteigerung.

SenseVoice veraarbecht Audio mat ongeféier 50.0x Echtzäit op eise GPUen. Eng 1 Stonn laang Audiodatei ass a manner wéi 1 Minutten ofgeschloss; méi laang Dateien ginn an d'Warteschlange gesat an no der Fertigstellung per E-Mail informéiert.

SenseVoice huet 234M Parameter. Grouss Modeller sinn dacks méi genee, awer méi lues; STT.ai huet SenseVoice op der GPU, sou datt d'Zuel vun de Parameteren Är Clientsleeschtung net beaflosst.

SenseVoice akzeptéiert all Formater déi STT.ai ënnerstëtzt — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, an aner. Ausgab als TXT, SRT, VTT, DOCX, JSON oder PDF.

D'Sprooch ass ronn 800.000 Leit bekannt, déi an der ganzer Welt geschwat ginn, an déi meescht vun hinnen an der Regioun liewen.

Ja. SenseVoice leeft an eiser verwalteter Ëmwelt — Audio gëtt standardméisseg veraarbecht a geléist a gëtt ni fir Training benotzt ouni explizit Opt-in. Pro Pläng addéieren Client-säiteg Verschlësselung fir Transkriptiounen am Ruhezustand.

D'Vergleiche-stt-Tool gëtt benotzt fir SenseVoice mat all anere Modeller ze vergläichen, déi op deem selwechten Audiosystem ënnerstëtzt ginn. Dobäi gesi mir WER, Segment-Zuel, Lautsprecher-Label an Zuverlässegkeetswäerter netzwierklech. De Verglach SenseVoice vs Whisper Large V3 gëtt am meeschte benotzt.

Ja. Gebt "sensevoice" als Modellparameter op dem /v1/transcribe Endpunkt un. Python an Node.js SDKs enthalen SenseVoice Beispiller. D'gratis API-Tier enthält 100 Minutten/Mount.

Ja. Well SenseVoice MIT-lizenzéiert ass, kënnt Dir et selwer hosten. D'Open-Source-Säit vun STT.ai lëscht de Projet-Repo an d'Gewiicht op. D'Meiste Produktiounsteams benotzen eis gehostete Versioun fir GPU-Beschaffung, Modell-Swaps an Ops ze iwwerhuelen.

Transkriptioun SenseVoice

Iwwer SenseVoice

Sproochen SenseVoice

Modellinformatioun

Verwandte Modeller

Häufig gestallte Froen

Si huet 88.000 Awunner.

Si huet 88.000 Awunner.

SenseVoice ass e fräien Numm.

D'Lizenz gouf den 8.

Wéi vill Sproochen ënnerstëtzt SenseVoice?

Si huet 88.000 Awunner.

Den CR388 ass e Chemin repris am Kanton Réiden.

D'Uertschaft huet ronn 8.000 Awunner.

SenseVoice ass e Mëssstänn.

Sidd meng Donnéeën privat wann ech SenseVoice benotze?

SenseVoice ass e Stärekoup am Stärebild Orion.

SenseVoice ass e Stärekoup am Stärebild Aquila.

SenseVoice ass eng Uertschaft an der Gemeng Réiden.