Bug / Feature Request mellen

AI Sproochkloner

Klont all Stëmm aus engem klenge Audioclip. Luet 3-10 Sekonnen Sprooch erop, gitt Ären Text an, an generéiert Audio an der selwechter Stëmm.

Sproochquell

Klonen aus Audio Virdefiniert Stimmen

Klonen: bitt e Referenzclip mat 3-10 Sekonne. Virprogramméiert: wielt aus de méisproochege Stimmen.

1. Sproochreferenz erofgelueden (3-10 Sek.)

Audio-Stëmmreferenz erofladen

MP3, WAV, M4A, FLAC

2. Ze schwätzende Text aginn

Max. 500 Zeichen

0/500

Et gëtt 1000 Kreditter pro Joer.

Wéi et funktionéiert

Referenz erofladen

Et gëtt 3 bis 10 verschidden Aarte vu Sproochen, déi an der Regioun geschwat ginn.

Lëscht vun de lëtzebuergesche Sproochen

D'Sprooch huet 5 Sproochegruppen: Dialekter.

Sprooch erzeugen

Äre Text gëtt an der klonéierter Stëmm gesot. Laden Sie das Ergebnis als WAV herunter.

Stëmmen klonen ass nëmme fir perséinlech a autoriséiert Gebrauch. Klont keng Stëmmen ouni d'Erlaabnes vum Sprecher.

D'Gesetz ass net nëmmen eng Verfassung, mä och eng Gesetzeshandlung.

D'Sprooch ass eng vun de gréisste Sproochen op der Welt, mat iwwer 100 Milliounen Awunner, déi ronn 100 Sproochen schwätzen.

Websäit vu Free 600 Joer Lëtzebuerger Literatur

Häufig gestallte Froen

Stëmmkloning leeft an Ärem Browser: fügt eng URL an, laadt eng Datei erop oder huelen aus Ärem Mikro op. STT.ai wielt d'KI-Modell aus an zitt d'Transkriptioun an ënner 5 Minutten zréck. Exportéiert als TXT, SRT, VTT, DOCX, JSON oder PDF.

Ja — all Besucher kritt 600 gratis Minutten fir op STT.ai ze starten, déi fir Stëmmkloning wéi all aner Workflows benotzt kënne ginn. Bezuelte Pläng, déi vu $5/Mount ugefaangen, erlaben méi laang Dateien, privat Transkriptiounen a Prioritéits-Queuen.

Stëmmkloning leeft op de selwechte KI-Modeller wéi den Rest vun STT.ai - eis bescht Modeller erreechen 95-97% Genauegkeet bei klorer Sprooch (3-5% Wuertfehlerquote bei Benchmarks). Wechseln Sie Modelle auf der Flucht, wenn die erste Passe unterhalb Ihres Ziels ist.

Stëmmkloning can run on any of STT.ai's 10+ models — STT.ai Enhanced (most accurate), Whisper Large V3 (99 languages), NVIDIA Canary (#1 WER on supported langs), Whisper Turbo (fast), Moonshine (lightweight), and more.

Ja. All Transkriptioun gëtt als SRT oder VTT exportéiert - funktionnéiert mat YouTube, Vimeo, TikTok, VLC an all grousse Videospiller. D'Brenn-Ënnertitelen-Tool iwwerdeckt se op Videoen als Hardsubs.

Ja. D' Sprecher- Diariséierung bezeechent all Stëmm automatesch (Sprecher 1, Sprecher 2,...) an Dir kënnt se am integréierten Editor ëmnennen. Funktiounéiert op all Modeller a Sproochen.

D'Meeschte Stëmmkloning Aufgaben sinn an ënner 5 Minutten ofgeschloss. Eng Audiodatei vun enger Stonn ass normalerweis an 2-3 Minutten ofgeschloss mat eise séiersten Modeller. D'Geschwindegkeet hänkt vum gewielten Modell an der aktueller GPU-Belaaschtung of.

Stëmmkloning akzeptéiert méi wéi 20 Formater — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, an aner. Ausgabeformat: TXT, SRT, VTT, DOCX, JSON oder PDF.

Ja. Audiodateien déi un Stëmmkloning geschéckt ginn, ginn standardméisseg veraarbecht an ewechgeholl. Pro-Pläng bidden Client-säiteg Verschlësselung - och wann d'STT.ai-Datebank gebrach gëtt, sinn Är Transkriptiounen ouni Äre Schlëssel net liesbar. D'Daten ginn ni fir Modelltraining benotzt ouni explizit Opt-in.

D'STT.ai bitt eng REST API mat Python an Node.js SDKs, plus en MCP Server fir Claude an Cursor — all fir Stëmmkloning Workflows benotzt. D'Free API Tier enthält 100 Minutten / Mount.

Ja. All Transkriptioun gëtt am integréierten Editor opgemaach, wou Dir Wierder korrigéiere kënnt, Sprecher ëmnennen, Zäitstempelen upassen an Notizen bäifügen. All Ännerunge ginn automatesch gespäichert.

All Transkript kritt eng eenzegaarteg URL fir ze deelen. Exportéiert als DOCX oder PDF fir E-Mail. Pro-Pläng addéieren passwuertgeschützt a permanent Links - nëtzlech fir Clientsaarbecht.

STT.ai handles 1,300+ platforms including YouTube, Vimeo, TikTok, SoundCloud, Zoom, Google Meet, podcast hosts, and more. URL transcription works with publicly-available content only — DRM-protected sources can't be transcribed.

AI Sproochkloner

Generéiert Audio

Wéi et funktionéiert

D'Gesetz ass net nëmmen eng Verfassung, mä och eng Gesetzeshandlung.

Häufig gestallte Froen

Wéi funktionnéiert Stëmmkloning op STT.ai?

Ass Stëmmkloning fräi?

Wéi genee ass Stëmmkloning?

Wat fir KI-Modeller kann ech fir Stëmmkloning benotzen?

Kann ech Ënnertitelen aus Stëmmkloning kréien?

Erkennt Stëmmkloning verschidde Lautsprecher?

Wéi laang dauert Stëmmkloning?

Wat fir Inputformater gëtt vum Stëmmkloning ënnerstëtzt?

Ass meng Audio privat wann ech Stëmmkloning benotze?

Ass et eng Stëmmkloning API?

Kann ech eng Stëmmkloning Transkriptioun nodeem bearbeiten?

Wéi deelen ech dat wat Stëmmkloning produzéiert?

Op wéi enge Plattformen funktionnéiert et nieft Stëmmkloning?