Rapporto Bug / Richiesta di Funzionalità

AI Voice Cloner

Klone n'omwe vo a partir d'un court clip audio.Upload 3-10 secondes de parole, tapez votre texte, et générer l'audio dans la même voix.

Voice Source

Clone from audio Preset voices

Clone: provide a 3–10s reference clip. Preset: pick from bundled multilingual voices.

1. Upload Voice Reference (3-10 sec) (upload de la référence vocale)

Upload voice reference audio

MP3, WAV, M4A, FLAC

2. Introduce Text to Speak (Introduce Text to Speak)

Max 500 characters

0/500

Usa 1 credit per generation

Como funciona

Upload Reference

Fornire 3-10 secondes de parole claire de la voix que vous voulez cloner.

AI Analyzes Voice

F5-TTS extrait les caractéristiques de la voix: ton, pitch, style de parole, accent.

Generate Speech

Votre texte est prononcé dans la voix clonée. Téléchargez le résultat en WAV.

Klonage de voix est pour usage personnel et autorisé seulement.Ne pas cloner des voix sans le consentement de l'orateur.

Frequently Asked Questions - FAQ

Upload your audio or video file to STT.ai, paste an URL, or record live. Select your preferred AI model and click Transcribe. Most files complete in under 5 minutes. Export as TXT, SRT, VTT, DOCX, JSON, or PDF.

Yes — STT.ai da 600 minutos gratis/mes a cada visitante sem necessidade de inscrição para o seu primeiro arquivo. Planos pagos a partir de $5/mês desbloqueiam arquivos maiores, transcrições privadas e fila de prioridade.

La précision dépend du modèle et de la qualité audio. Nos meilleurs modèles atteignent un taux d'erreur de 3-5% sur les benchmarks — 95-97% de précision sur la parole claire. L'outil compare-stt vous permet de lancer plusieurs modèles sur le même fichier et de choisir le meilleur.

STT.ai offre plus de 10 modèles — STT.ai Enhanced (notre plus précis), Whisper Large V3 (99 langues), NVIDIA Canary (#1 WER sur les langes supportés), Whisper Turbo (rapide), Moonshine (léger), et plus.Chaque page de modèle a des détails.

Yep. Exporte ta transkripte komo SRT o VTT file de subtitles — i ti'n travaye na YouTube, Vimeo, TikTok, VLC, et tout autre player vidéo majeur. L'outil de gravure des sous-titres les superpose sur le vidéo comme des hardsubs.

Yes. Speaker diarization automatically labels each voice (Speaker 1, Speaker 2,...) and you can rename them in the editor. Works across all models and languages.

La plupart des fichiers sont transcrits en moins de 5 minutes. Un fichier audio d'une heure se termine généralement en 2-3 minutes avec nos modèles les plus rapides.La vitesse dépend du choix du modèle et de la charge actuelle.

STT.ai supports 20+ input formats — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI and others.Output to TXT, SRT, VTT, DOCX, JSON, and PDF.

Ya. Fichiers audio sont traités et supprimés par défaut. Les plans Pro ajoutent un encryptage côté client — même si notre base de données est violée, vos transcriptions sont indéchiffrables sans votre clé. Les données ne sont jamais utilisées pour la formation de modèles sans explicite opt-in.

STT.ai offre une API REST avec des SDK Python et Node.js, plus un serveur MCP pour Claude et Cursor. Le niveau d'API gratuit comprend 100 minutes/mois.

Ya. Toute transcription s'ouvre dans notre éditeur intégré où vous pouvez corriger des mots, renommer des orateurs, ajuster des timestamps et ajouter des notes.Toutes les modifications sont sauvegardées automatiquement.

Ekspore na DOCX o PDF ko email. Pro plans adjoint password-protected and permanent links — useful for client work.Ekspore na DOCX o PDF ko email ko email.

STT.ai supporte plus de 1 300 plateformes, dont YouTube, Vimeo, TikTok, SoundCloud, et plus encore.La transcription des URL fonctionne uniquement avec du contenu accessible au public.

AI Voice Cloner

Generated Audio

Como funciona

Frequently Asked Questions - FAQ

Como faço para transcribir audio com STT.ai?

Is STT.ai free?

Koliko accurate is STT.ai's transcription?

Quels modèles AI puis-je utiliser?

Posso avere sottotitoli e sottotitoli?

STT.ai detekita balongo balongo?

Koliko dugo traje transkriptija?

Quels formats de fichiers sont supportés?

Me data audio e tene na privacité?

Posso accedere alla trascrizione tramite API?

Posso editare la trascrizione dopo?

Como posso compartilhar meu transcripto?

Quels sont les URLs et les plateformes supportées?