Informar de fallo / Petición de características

Herramienta de transcripción en línea gratuita

Sube un archivo, graba con tu micrófono o pega una URL. La IA transcribe en segundos.

Funciona con audio y vídeo de acceso público. El contenido protegido por DRM no es compatible.

Actualizar para mejorar

Transcripciones privadas

Charla con transcripción

Desbloquear con Pro →

Soltar archivo aquí o haga clic para navegar

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — hasta 2 GB

Cargar varios archivos por lotes con Pro

Actualizar para mejorar

Transcripciones privadas

Charla con transcripción

Desbloquear con Pro →

Actualizar para mejorar

Discurso en tiempo real al texto. IA corrige automáticamente mientras habla — la precisión mejora con un discurso más largo.

Pon a prueba tu micrófono primero

10 min/día gratis 600 min gratis con registro Sin tarjeta de crédito Cifrado

Inscríbete gratis →

100+ idiomas

Detección automática o selección manual. Todos los idiomas principales compatibles.

Detección de hablantes

Identifica automáticamente quién dijo qué.

Cifrado del lado del cliente

Cifra las transcripciones en tu navegador. Ni siquiera nosotros podemos leerlas.

6 formatos de exportación

TXT, SRT, VTT, DOCX, JSON, PDF.

Formatos de audio y video compatibles

MP3 WAV M4A FLAC OGG MP4 MKV MOV WebM AVI AAC OPUS WMA

Sube archivos de hasta 2GB. También soportamos más de 1,300 plataformas — solo pega la URL. Ver todas las plataformas →

Funciona con audio y vídeo de acceso público. El contenido protegido por DRM no es compatible.

Cómo funciona

Sube o graba

Sube un archivo de audio/video, pega una URL de YouTube o cualquier plataforma, o graba con tu micrófono.

La IA transcribe

Elige entre múltiples modelos de IA. Detección automática de idioma. La diarización identifica quién dijo qué.

Exporta y comparte

Descarga como TXT, SRT, VTT, DOCX, JSON o PDF. Comparte con un enlace. Mejora con IA para mayor precisión.

100+ idiomas

Ver todos los idiomas compatibles con información de precisión

Modelos de IA

Compara Whisper, Canary y más

API y SDKs

Transcribe programáticamente con Python o Node.js

Preguntas frecuentes

transcripción se ejecuta en su navegador: pega una URL, carga un archivo o graba desde su micrófono. STT.ai elige el modelo de IA y devuelve la transcripción en menos de 5 minutos. Exportar como TXT, SRT, VTT, DOCX, JSON o PDF.

Sí — cada visitante tiene 600 minutos libres para comenzar en STT.ai, utilizable para transcripción lo mismo que cualquier otro flujo de trabajo. Planes pagados a partir de $5 / mes desbloquear archivos más largos, transcripciones privadas y cola de prioridad.

transcripción se ejecuta en los mismos modelos de IA que el resto de STT.ai — nuestros mejores modelos alcanzan 95-97% de precisión en voz limpia (3-5% de tasa de error de Word en los puntos de referencia).

transcripción puede funcionar en cualquiera de los modelos de STT.ai 10+ — STT.ai Enhanced (más preciso), Whisper Large V3 (99 idiomas), NVIDIA Canary (#1 WER en langs soportados), Whisper Turbo (rápido), Moonshine (peso ligero), y más.

Sí. Cada transcripción exporta como SRT o VTT — trabaja con YouTube, Vimeo, TikTok, VLC, y cada reproductor de vídeo importante. La herramienta de subtítulos de grabación los superpone al vídeo como su-des.

Sí. Diarización de altavoz automáticamente etiqueta cada voz (hablador 1, altavoz 2,...) y puede cambiar el nombre en el editor incorporado. Funciona en todos los modelos y lenguajes.

La mayoría de los trabajos transcripción terminan en menos de 5 minutos. Un archivo de audio de 1 hora normalmente se completa en 2-3 minutos con nuestros modelos más rápidos. La velocidad depende del modelo elegido y la carga actual de GPU.

transcripción acepta más de 20 formatos — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, y más. Salida a TXT, SRT, VTT, DOCX, JSON, o PDF.

Sí. Los archivos de audio enviados a transcripción se procesan y eliminan por defecto. Los planes Pro añaden cifrado del lado del cliente, incluso si se rompe la base de datos de STT.ai, sus transcripciones son ilegibles sin su clave. Los datos nunca se utilizan para la formación de modelos sin opt-in explícito.

Sí. STT.ai ofrece una API REST con Python y SDKs Node.js, además de un servidor MCP para Claude y Cursor, todo utilizable para flujos de trabajo transcripción. El nivel de API gratuita incluye 100 minutos/mes.

Sí. Cada transcripción se abre en el editor integrado donde puede corregir palabras, cambiar el nombre de los altavoces, ajustar marcas de tiempo y añadir notas. Todos los cambios se guardan automáticamente.

Cada transcripción obtiene una URL compartida única. Exportar a DOCX o PDF para el correo electrónico. Planes Pro añadir enlaces permanentes y protegidos con contraseña — útiles para el trabajo del cliente.

STT.ai maneja 1.300 plataformas más, incluyendo YouTube, Vimeo, TikTok, SoundCloud, Zoom, Google Meet, hosts de podcasts, y más. La transcripción de URL funciona con contenido disponible únicamente para el público — fuentes protegidas por DRM no pueden ser transcritas.

Herramienta de transcripción en línea gratuita

Formatos de audio y video compatibles

Cómo funciona

Sube o graba

La IA transcribe

Exporta y comparte

Preguntas frecuentes

¿Cómo funciona transcripción en STT.ai?

Is transcripción free?

¿Qué tan preciso es transcripción?

¿Qué modelos de IA puedo utilizar para transcripción?

¿Puedo obtener subtítulos de transcripción?

¿Detecta transcripción diferentes altavoces?

¿Cuánto tiempo tarda transcripción?

¿Qué formatos de entrada soporta transcripción?

¿Mi audio es privado cuando uso transcripción?

¿Hay una API transcripción?

¿Puedo editar una transcripción de transcripción después?

¿Cómo puedo compartir lo que transcripción produce?

¿Qué otras plataformas funcionan más allá de transcripción?