Formatos de exportación

Descargue sus transcripciones en el formato que necesite. STT.ai soporta seis formatos de exportación, cada uno optimizado para diferentes flujos de trabajo.

Funciona con audio y vídeo de acceso público. El contenido protegido por DRM no es compatible.

Actualizar para mejorar
Private transcript
Charla con transcripción
Desbloquear con Pro →
Soltar archivo aquí o haga clic para navegar
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — hasta 2 GB
Actualizar para mejorar
Private transcript
Charla con transcripción
Desbloquear con Pro →
Actualizar para mejorar
Grabación: 0:00
En tiempo real Vosk (instante)
Mejorado Susurro (exacto)
Enlaces públicos: 24h, sólo texto · Inscríbete para 7d + audio · Pro para enlaces privados

Discurso en tiempo real al texto. IA corrige automáticamente mientras habla — la precisión mejora con un discurso más largo.

Pon a prueba tu micrófono primero
❤️ ¡Díselo a tus amigos!
Has usado tus transcripciones gratis.

Regístrese gratis para obtener 600 minutos / mes, o actualizar para transcripciones ilimitadas.

10 min/día gratis 600 min gratis con registro Sin tarjeta de crédito Cifrado
Inscríbete gratis →

Formatos de exportación compatibles

Después de transcribir su audio o video, puede descargar la transcripción en cualquiera de los siguientes formatos. Todos incluyen el texto completo, y los formatos temporizados incluyen marcas de tiempo a nivel de palabra o segmento.

TXT (Texto plano)

.txt

Transcripción en texto plano simple sin formato. Ideal para copiar en documentos, correos u otras aplicaciones. Incluye etiquetas de hablante cuando la detección está habilitada.

Free plan

SRT (Subtítulo SubRip)

.srt

El formato de subtítulos más ampliamente soportado. Incluye numeración secuencial, marcas de tiempo y texto. Compatible con YouTube, Vimeo, VLC, Premiere Pro, Final Cut y prácticamente todos los reproductores y editores de video.

Free plan

VTT (WebVTT)

.vtt

Formato Web Video Text Tracks, el estándar para subtítulos de video HTML5. Soporta estilos, posicionamiento y metadatos. Usado por navegadores web, plataformas de streaming y reproductores de video modernos.

Basic plan+

DOCX (Documento Word)

.docx

Documento Word formateado con encabezados, marcas de tiempo y etiquetas de hablante. Ideal para actas de reuniones, informes y documentos que necesitan edición adicional en Microsoft Word o Google Docs.

Basic plan+

JSON (Datos estructurados)

.json

Formato estructurado legible por máquina con marcas de tiempo a nivel de palabra, puntuaciones de confianza, IDs de hablante y datos de segmento. Perfecto para desarrolladores que construyen sobre STT.ai o alimentan datos a otros sistemas.

Basic plan+

PDF (Documento portátil)

.pdf

PDF formateado profesionalmente con marcas de tiempo, etiquetas de hablante y marca STT.ai. Ideal para compartir con clientes, archivar registros o imprimir. Diseño optimizado para legibilidad.

Basic plan+

Comparación de formatos

Característica TXT SRT VTT DOCX JSON PDF
Plain text
Timestamps
Speaker labels
Word-level timing
Confidence scores
Video player compatible
Editable
Machine-readable

¿Qué formato debería elegir?

Para subtítulos

Use SRT for maximum compatibility or VTT for web-based video players. SRT works with YouTube, Vimeo, Premiere Pro, Final Cut, and DaVinci Resolve.

Para documentos e informes

Use DOCX for editable documents or PDF for sharing and archiving. Both include formatted timestamps and speaker labels.

Para desarrolladores e integraciones

Use JSON for the richest data including word-level timestamps, confidence scores, and speaker IDs. Ideal for building custom applications.

Para copiar y pegar rápido

Use TXT for a simple plain text transcript you can paste anywhere -- emails, notes, chat, or any text field.

Exportación por lotes

Need to export multiple transcripts at once? STT.ai supports batch export from your transcript library. Select multiple transcripts, choose your format, and download them all in a single ZIP file. Available on all paid plans.

Exportación API

Developers can retrieve transcripts in any format via the STT.ai API. Simply specify the desired format in your API request and receive the formatted output directly. The JSON format includes the most detailed data including word-level timestamps and confidence scores.

Transcriba y exporte en cualquier formato

Suba audio o video. Elija su formato. Descarga instantánea.

Comenzar a transcribir gratis

Preguntas frecuentes

export formats runs in your browser: paste a URL, upload a file, or record from your mic. STT.ai picks the AI model and returns the transcript in under 5 minutes. Export as TXT, SRT, VTT, DOCX, JSON, or PDF.

Yes — every visitor gets 600 free minutes/month on STT.ai, usable for export formats the same as any other workflow. Paid plans starting at $5/month unlock longer files, private transcripts, and priority queueing.

export formats runs on the same AI models as the rest of STT.ai — our best models reach 95-97% accuracy on clean speech (3-5% Word Error Rate on benchmarks). Switch models on the fly if the first pass is below your target.

export formats can run on any of STT.ai's 10+ models — STT.ai Enhanced (most accurate), Whisper Large V3 (99 languages), NVIDIA Canary (#1 WER on supported langs), Whisper Turbo (fast), Moonshine (lightweight), and more.

Yes. Every transcript exports as SRT or VTT — works with YouTube, Vimeo, TikTok, VLC, and every major video player. The burn-subtitles tool overlays them onto video as hardsubs.

Yes. Speaker diarization automatically labels each voice (Speaker 1, Speaker 2, ...) and you can rename them in the built-in editor. Works across all models and languages.

Most export formats jobs finish in under 5 minutes. A 1-hour audio file typically completes in 2-3 minutes with our fastest models. Speed depends on chosen model and current GPU load.

export formats accepts 20+ formats — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and more. Output to TXT, SRT, VTT, DOCX, JSON, or PDF.

Yes. Audio files submitted to export formats are processed and deleted by default. Pro plans add client-side encryption — even if STT.ai's database is breached, your transcripts are unreadable without your key. Data is never used for model training without explicit opt-in.

Yes. STT.ai offers a REST API with Python and Node.js SDKs, plus an MCP server for Claude and Cursor — all usable for export formats workflows. Free API tier includes 100 minutes/month.

Yes. Every transcript opens in the built-in editor where you can correct words, rename speakers, adjust timestamps, and add notes. All changes save automatically.

Every transcript gets a unique shareable URL. Export to DOCX or PDF for email. Pro plans add password-protected and permanent links — useful for client work.

STT.ai handles 1,300+ platforms including YouTube, Vimeo, TikTok, SoundCloud, Zoom, Google Meet, podcast hosts, and more. URL transcription works with publicly-available content only — DRM-protected sources can't be transcribed.