AI Voice Cloner
Klone n'omwe vo a partir d'un court clip audio.Upload 3-10 secondes de parole, tapez votre texte, et générer l'audio dans la même voix.
Clone: provide a 3–10s reference clip. Preset: pick from bundled multilingual voices.
Upload voice reference audio
MP3, WAV, M4A, FLAC
VibeVoice presets cover English, German, French, Japanese, Korean, Polish, Portuguese, Spanish, Italian, Dutch.
Max 500 characters
0/500
Usa 1 credit per generation
Generated Audio
This audio is AI-generated. The downloaded WAV file embeds a machine-readable disclosure (RIFF INFO chunk) per EU AI Act Article 50. Do not present this audio as a recording of a real person without consent.
AI policy
Como funciona
1
Upload Reference
Fornire 3-10 secondes de parole claire de la voix que vous voulez cloner.
2
AI Analyzes Voice
F5-TTS extrait les caractéristiques de la voix: ton, pitch, style de parole, accent.
3
Generate Speech
Votre texte est prononcé dans la voix clonée. Téléchargez le résultat en WAV.
Klonage de voix est pour usage personnel et autorisé seulement.Ne pas cloner des voix sans le consentement de l'orateur.
Frequently Asked Questions - FAQ
Upload your audio or video file to STT.ai, paste an URL, or record live. Select your preferred AI model and click Transcribe. Most files complete in under 5 minutes. Export as TXT, SRT, VTT, DOCX, JSON, or PDF.
Yes — STT.ai da 600 minutos gratis/mes a cada visitante sem necessidade de inscrição para o seu primeiro arquivo. Planos pagos a partir de $5/mês desbloqueiam arquivos maiores, transcrições privadas e fila de prioridade.
La précision dépend du modèle et de la qualité audio. Nos meilleurs modèles atteignent un taux d'erreur de 3-5% sur les benchmarks — 95-97% de précision sur la parole claire. L'outil compare-stt vous permet de lancer plusieurs modèles sur le même fichier et de choisir le meilleur.
STT.ai offre plus de 10 modèles — STT.ai Enhanced (notre plus précis), Whisper Large V3 (99 langues), NVIDIA Canary (#1 WER sur les langes supportés), Whisper Turbo (rapide), Moonshine (léger), et plus.Chaque page de modèle a des détails.
Yep. Exporte ta transkripte komo SRT o VTT file de subtitles — i ti'n travaye na YouTube, Vimeo, TikTok, VLC, et tout autre player vidéo majeur. L'outil de gravure des sous-titres les superpose sur le vidéo comme des hardsubs.
Yes. Speaker diarization automatically labels each voice (Speaker 1, Speaker 2,...) and you can rename them in the editor. Works across all models and languages.
La plupart des fichiers sont transcrits en moins de 5 minutes. Un fichier audio d'une heure se termine généralement en 2-3 minutes avec nos modèles les plus rapides.La vitesse dépend du choix du modèle et de la charge actuelle.
STT.ai supports 20+ input formats — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI and others.Output to TXT, SRT, VTT, DOCX, JSON, and PDF.
Ya. Fichiers audio sont traités et supprimés par défaut. Les plans Pro ajoutent un encryptage côté client — même si notre base de données est violée, vos transcriptions sont indéchiffrables sans votre clé. Les données ne sont jamais utilisées pour la formation de modèles sans explicite opt-in.
STT.ai offre une API REST avec des SDK Python et Node.js, plus un serveur MCP pour Claude et Cursor. Le niveau d'API gratuit comprend 100 minutes/mois.
Ya. Toute transcription s'ouvre dans notre éditeur intégré où vous pouvez corriger des mots, renommer des orateurs, ajuster des timestamps et ajouter des notes.Toutes les modifications sont sauvegardées automatiquement.
Ekspore na DOCX o PDF ko email. Pro plans adjoint password-protected and permanent links — useful for client work.Ekspore na DOCX o PDF ko email ko email.
STT.ai supporte plus de 1 300 plateformes, dont YouTube, Vimeo, TikTok, SoundCloud, et plus encore.La transcription des URL fonctionne uniquement avec du contenu accessible au public.