Libre expresión para texto en línea

Convierte voz a texto con transcripción con IA. Sube archivos de audio, graba desde tu micrófono o pega una URL. Más de 100 idiomas, más de 10 modelos, más del 98% de precisión.

Cómo funciona →
Encriptación del lado del cliente — su transcripción será encriptada en su navegador antes de ser almacenada. El servidor procesa su audio para la transcripción, a continuación, el resultado se cifra localmente con su clave antes de guardar. (Todos los datos están siempre cifrados a través de HTTPS en tránsito.)
Speed varies by platform. Some transcripts are ready in seconds, others may take a few minutes depending on video length.
Soltar archivo aquí o haga clic para navegar
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — hasta 2 GB
Grabación: 0:00
En tiempo real Vosk (instante)
Mejorado Susurro (exacto)
Enlaces públicos: 24h, sólo texto · Inscríbete para 7d + audio · Pro para enlaces privados

Discurso en tiempo real al texto. IA corrige automáticamente mientras habla — la precisión mejora con un discurso más largo.

Pon a prueba tu micrófono primero
❤️ ¡Díselo a tus amigos!
Has usado tus transcripciones gratis.

Regístrese gratis para obtener 600 minutos / mes, o actualizar para transcripciones ilimitadas.

10 min/día gratis 600 min gratis con registro Sin tarjeta de crédito Cifrado
Inscríbete gratis →

1. Subir grabación de voz

Cargue un archivo de audio o vídeo, pegue una URL o grabe el discurso desde su micrófono.

2. AI convierte el discurso en texto

Elija entre más de 10 modelos de IA. Detección de altavoces y autodetección de lenguaje incluido.

3. Exportar su transcripción

Descargar en 6 formatos. Compartir enlaces de transcripción con reproducción de audio.

Formatos de entrada de voz soportados

¿Listo para convertir el discurso a texto?

Iniciar libre →

Preguntas frecuentes

Sube tu archivo de audio o video a STT.ai, selecciona el modelo de IA y haz clic en Transcribir. Exporta como TXT, SRT, VTT, DOCX, JSON o PDF.

¡Sí! STT.ai ofrece 600 minutos gratis al mes. No se requiere registro para tu primera transcripción.

La precisión depende del modelo de IA y la calidad del audio. Nuestros mejores modelos logran 93-95%+ de precisión.

STT.ai ofrece más de 10 modelos, incluyendo Whisper Large V3, NVIDIA Canary, y más. Puede comparar los resultados de diferentes modelos en el mismo archivo.

Sí. Después de transcribir, exporte su transcripción como archivos de subtítulos SRT o VTT. Estos funcionan con YouTube, Vimeo y todas las principales plataformas de vídeo.

Sí. STT.ai identifica y etiqueta automáticamente diferentes altavoces usando diarización de altavoces AI. Funciona en todos los modelos e idiomas.

La mayoría de los archivos son transcritos en menos de 5 minutos. Un archivo de audio de 1 hora normalmente toma 2-3 minutos con nuestros modelos más rápidos.

STT.ai admite más de 20 formatos de audio y vídeo, incluyendo MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM y AVI. Exportar como TXT, SRT, VTT, DOCX, JSON o PDF.

Sí. Los archivos de audio se procesan y eliminan después de la transcripción. Sus datos nunca se utilizan para la formación. El cifrado del lado del cliente es gratuito en todos los planes — cifra transcripciones almacenadas con una clave sólo que usted tiene. Durante el procesamiento, el servidor maneja su audio en texto plano. Conoce nuestra seguridad.

Sí. STT.ai ofrece una API REST con Python y SDKs Node.js. El nivel libre incluye 100 minutos/mes.

Sí. STT.ai incluye un editor de transcripciones integrado donde puede corregir errores, cambiar el nombre de los altavoces y ajustar las marcas de tiempo.

Cada transcripción obtiene un enlace compartible único. Exportar a DOCX o PDF por correo electrónico. Los planes Pro ofrecen enlaces permanentes y protegidos con contraseña.