Herramienta de transcripción en línea gratuita

Sube un archivo, graba con tu micrófono o pega una URL. La IA transcribe en segundos.

Funciona con audio y vídeo de acceso público. El contenido protegido por DRM no es compatible.

Actualizar para mejorar
Private transcript
Charla con transcripción
Desbloquear con Pro →
Soltar archivo aquí o haga clic para navegar
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — hasta 2 GB
Actualizar para mejorar
Private transcript
Charla con transcripción
Desbloquear con Pro →
Actualizar para mejorar
Grabación: 0:00
En tiempo real Vosk (instante)
Mejorado Susurro (exacto)
Enlaces públicos: 24h, sólo texto · Inscríbete para 7d + audio · Pro para enlaces privados

Discurso en tiempo real al texto. IA corrige automáticamente mientras habla — la precisión mejora con un discurso más largo.

Pon a prueba tu micrófono primero
❤️ ¡Díselo a tus amigos!
Has usado tus transcripciones gratis.

Regístrese gratis para obtener 600 minutos / mes, o actualizar para transcripciones ilimitadas.

10 min/día gratis 600 min gratis con registro Sin tarjeta de crédito Cifrado
Inscríbete gratis →
100+ idiomas
Detección automática o selección manual. Todos los idiomas principales compatibles.
Detección de hablantes
Identifica automáticamente quién dijo qué.
Cifrado del lado del cliente
Cifra las transcripciones en tu navegador. Ni siquiera nosotros podemos leerlas.
6 formatos de exportación
TXT, SRT, VTT, DOCX, JSON, PDF.

Formatos de audio y video compatibles

MP3 WAV M4A FLAC OGG MP4 MKV MOV WebM AVI AAC OPUS WMA

Sube archivos de hasta 2GB. También soportamos más de 1,300 plataformas — solo pega la URL. Ver todas las plataformas →

Funciona con audio y vídeo de acceso público. El contenido protegido por DRM no es compatible.

Cómo funciona

1

Sube o graba

Sube un archivo de audio/video, pega una URL de YouTube o cualquier plataforma, o graba con tu micrófono.

2

La IA transcribe

Elige entre múltiples modelos de IA. Detección automática de idioma. La diarización identifica quién dijo qué.

3

Exporta y comparte

Descarga como TXT, SRT, VTT, DOCX, JSON o PDF. Comparte con un enlace. Mejora con IA para mayor precisión.

Preguntas frecuentes

Sube tu archivo de audio o vídeo a STT.ai, pega una URL o graba en vivo. Selecciona tu modelo de IA preferido y haz clic en Transcribir. La mayoría de los archivos se completan en menos de 5 minutos. Exporta como TXT, SRT, VTT, DOCX, JSON o PDF.

Sí — STT.ai da a cada visitante 600 minutos gratis al mes sin necesidad de registrarse para su primer archivo. Planes pagados a partir de $5/mes desbloquear archivos más largos, transcripciones privadas y cola de prioridad.

La precisión depende del modelo y de la calidad de audio. Nuestros mejores modelos alcanzan una tasa de error de Word del 3-5% en puntos de referencia — 95-97% de precisión en voz limpia. La herramienta compare-stt le permite ejecutar varios modelos en el mismo archivo y elegir el mejor.

STT.ai ofrece más de 10 modelos — STT.ai Enhanced (nuestro más preciso), Whisper Large V3 (99 idiomas), NVIDIA Canary (#1 WER en langs soportados), Whisper Turbo (rápido), Moonshine (peso ligero), y más. Cada página del modelo tiene detalles.

Sí. Exporte su transcripción como archivos de subtítulos SRT o VTT — trabajan con YouTube, Vimeo, TikTok, VLC, y cada reproductor de vídeo importante. La herramienta de subtítulos de grabación los superpone en vídeo como hardsubs.

Sí. Diarización del altavoz etiqueta automáticamente cada voz (hablador 1, altavoz 2,...) y se puede cambiar el nombre en el editor. Funciona en todos los modelos e idiomas.

La mayoría de los archivos son transcritos en menos de 5 minutos. Un archivo de audio de 1 hora normalmente termina en 2-3 minutos con nuestros modelos más rápidos. La velocidad depende de la elección del modelo y la carga actual.

STT.ai admite más de 20 formatos de entrada — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI y otros. Salida a TXT, SRT, VTT, DOCX, JSON y PDF.

Sí. Los archivos de audio se procesan y eliminan por defecto. Los planes Pro añaden cifrado del lado del cliente, incluso si nuestra base de datos se rompe, sus transcripciones son ilegibles sin su clave. Los datos nunca se utilizan para la formación de modelos sin opt-in explícito.

Sí. STT.ai ofrece una API REST con Python y SDKs Node.js, además de un servidor MCP para Claude y Cursor. El nivel gratuito de API incluye 100 minutos/mes.

Sí. Cada transcripción se abre en nuestro editor integrado donde puede corregir palabras, cambiar el nombre de los altavoces, ajustar marcas de tiempo y añadir notas. Todos los cambios se guardan automáticamente.

Cada transcripción obtiene una URL compartida única. Exportar a DOCX o PDF para correo electrónico. Los planes Pro añaden enlaces permanentes y protegidos con contraseña — útiles para el trabajo del cliente.

STT.ai admite más de 1.300 plataformas, incluyendo YouTube, Vimeo, TikTok, SoundCloud, y más. La transcripción de URL funciona solo con contenido disponible al público — las fuentes protegidas por DRM no se pueden transcribir.