Clonador de voz de IA
Clone calquera voz a partir dun clip de son curto. Envíe 3- 10 segundos de fala, escriba o seu texto e xere son coa mesma voz.
Enviar o son de referencia de voz
MP3, WAV, M4A, FLAC
Máx. 500 caracteres
0/500
Usa 1 crédito por xeración
Son xerado
Como funciona
1
Enviar a referencia
Proporcione 3- 10 segundos de fala clara da voz que queira clonar.
2
A IA analiza a voz
F5- TTS extrae as características da voz: ton, tonalidade, estilo de fala, acento.
3
Xerar voz
O texto é falado coa voz clonada. Obteña o resultado como WAV.
A clonación de voz é só para uso persoal e autorizado. Non clone voces sen o consentimento do falante.
Preguntas frecuentes
Envíe o seu ficheiro de son ou vídeo a STT.ai. Escolla o modelo e as opcións de IA que prefira e prema en Transcribir. A súa transcrición estará lista en minutos. Exporte como TXT, SRT, VTT, DOCX, JSON ou PDF.
Si! STT.ai ofrece 600 minutos gratuítos por mes para todos os usuarios. Non é preciso rexistrarse para a súa primeira transcrición. Os plans de pago con máis minutos e características comezan en $5/ mes.
A precisión depende do modelo de IA que escolla e da calidade do son. Os nosos mellores modelos acadan unha taxa de erro de palabra do 5- 7% nas probas, o que significa unha precisión do 93- 95%. Un son claro cun ruído de fondo mínimo produce os mellores resultados.
STT.ai ofrece máis de 10 modelos, incluíndo Whisper Large V3, NVIDIA Canary e outros. Pode comparar os resultados de diferentes modelos no mesmo ficheiro.
Si. Despois de transcreber, exporte a transcrición como ficheiros de subtítulos SRT ou VTT. Funcionan con YouTube, Vimeo e todas as plataformas de vídeo principais.
Si. O STT.ai identifica e etiqueta automaticamente diferentes altofalantes empregando a diarización de altofalantes da IA. Funciona en todos os modelos e linguaxes.
A maioría dos ficheiros transcríbense en menos de 5 minutos. Un ficheiro de son de 1 hora normalmente tarda 2- 3 minutos cos nosos modelos máis rápidos.
STT.ai soporta máis de 20 formatos de son e vídeo, incluíndo MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM e AVI. Exporta como TXT, SRT, VTT, DOCX, JSON ou PDF.
Si. Os ficheiros de son son procesados e eliminados despois da transcrición. Os seus datos nunca se empregan para adestramento. O cifrado do lado do cliente é gratuíto en todos os plans — cifra as transcricións almacenadas cunha chave que só ten vostede. Durante o procesamento, o servidor xestiona o seu son en texto plano. Aprenda sobre a nosa seguridade.
Si. STT.ai ofrece unha API REST con Python e Node. js SDKs. O nivel gratuíto inclúe 100 minutos/ mes.
Si. O STT.ai inclúe un editor de transcrición incorporado onde pode corrixir erros, mudar o nome dos oradores e axustar os selos de tempo.
Cada transcrición obtén unha ligazón única compartible. Exportar a DOCX ou PDF para enviar por correo electrónico. Os plans Pro ofrecen ligazóns permanentes e protexidas por contrasinal.