Formatos de exportación

Obteña as súas transcricións no formato que precise. STT.ai admite seis formatos de exportación, cada un optimizado para diferentes fluxos de traballo.

Funciona con son e vídeo dispoñíbeis publicamente. Non se admiten contidos protexidos con DRM.

Actualización para mellorado
Private transcript
Conversa con transcrición
Desbloquear con Pro →
Solte aquí o ficheiro ou prema para examinar
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — ata 2 GB
Actualización para mellorado
Private transcript
Conversa con transcrición
Desbloquear con Pro →
Actualización para mellorado
Gravación: 0:00
En tempo real Cera (instantánea)
Mellorado Sussurrar (preciso)
Ligazóns públicas: 24h, só texto · Inscríbete para 7d + audio · Pro para ligazóns privadas

Fala a texto en tempo real. A IA corrixe automaticamente mentres fala — a precisión mellora coa duración da fala.

Probe primeiro o micrófono
❤️ Amas STT.ai?
Esgotou as súas transcricións libres.

Inscríbase de balde para obter 600 minutos/mes, ou actualícese para obter transcricións ilimitadas.

10 minutos libres/día 600 min gratis con rexistro Sen tarxeta de crédito Cifrado
Inscríbete gratis →

Formatos de exportación soportados

Despois de transcreber o son ou vídeo, pode obter a transcrición en calquera dos seguintes formatos. Todos os formatos inclúen o texto completo da transcrición, e os formatos cronometrados inclúen marcas de tempo a nivel de palabra ou segmento.

TXT (Texto simple)

.txt

Transcrición de texto simple sen formatación. Mellor para copiar en documentos, correos electrónicos ou outros programas. Inclúe etiquetas de falante cando a detección de falante está activada.

Free plan

SRT (SubRip Subtítulos)

.srt

O formato de subtítulos máis amplamente soportado. Inclúe numeración secuencial, marcas de tempo e texto. Compatible con YouTube, Vimeo, VLC, Premiere Pro, Final Cut e virtualmente todos os reprodutores e editores de vídeo.

Free plan

VTT (WebVTT)

.vtt

Formato Web Video Text Tracks, o estándar para os subtítulos de vídeo HTML5. Soporta estilo, posición e metadatos. Emprégase nos navegadores web, plataformas de transmisión e reprodutores de vídeo modernos.

Basic plan+

DOCX (Documento de Word)

.docx

Documento de Word formatado con títulos, marcas de data e hora e etiquetas de orador axeitadas. Ideal para actas de reunións, informes e documentos que precisen de edición adicional en Microsoft Word ou Google Docs. Name

Basic plan+

JSON (datos estruturados)

.json

Formato estruturado lexíbel por máquina con marcas de tempo a nivel de palabra, puntuacións de confianza, ID de falantes e datos de segmentos. Perfecto para desenvolventes que constrúan enriba do STT.ai ou que alimenten datos noutros sistemas.

Basic plan+

PDF (Portable Document)

.pdf

PDF con formato profesional con marcas de data e hora, etiquetas de orador e marca STT.ai. Ideal para compartir con clientes, arquivar rexistros ou imprimir. A disposición está optimizada para a legibilidade.

Basic plan+

Comparación de formatos

Característica TXT SRT VTT DOCX JSON PDF
Plain text
Timestamps
Speaker labels
Word-level timing
Confidence scores
Video player compatible
Editable
Machine-readable

Que formato debe escoller?

Para subtítulos e títulos

Use SRT for maximum compatibility or VTT for web-based video players. SRT works with YouTube, Vimeo, Premiere Pro, Final Cut, and DaVinci Resolve.

Para documentos e informes

Use DOCX for editable documents or PDF for sharing and archiving. Both include formatted timestamps and speaker labels.

Para desenvolvedores e integracións

Use JSON for the richest data including word-level timestamps, confidence scores, and speaker IDs. Ideal for building custom applications.

Para copiar e apegar rapidamente

Use TXT for a simple plain text transcript you can paste anywhere -- emails, notes, chat, or any text field.

Exportación en lote

Need to export multiple transcripts at once? STT.ai supports batch export from your transcript library. Select multiple transcripts, choose your format, and download them all in a single ZIP file. Available on all paid plans.

Exportación API

Developers can retrieve transcripts in any format via the STT.ai API. Simply specify the desired format in your API request and receive the formatted output directly. The JSON format includes the most detailed data including word-level timestamps and confidence scores.

Transcríbeo e expórtao en calquera formato

Enviar o son ou vídeo. Escolla o formato de exportación. Obter instantaneamente.

Comezar a transcrición libre

Preguntas frecuentes

export formats runs in your browser: paste a URL, upload a file, or record from your mic. STT.ai picks the AI model and returns the transcript in under 5 minutes. Export as TXT, SRT, VTT, DOCX, JSON, or PDF.

Yes — every visitor gets 600 free minutes/month on STT.ai, usable for export formats the same as any other workflow. Paid plans starting at $5/month unlock longer files, private transcripts, and priority queueing.

export formats runs on the same AI models as the rest of STT.ai — our best models reach 95-97% accuracy on clean speech (3-5% Word Error Rate on benchmarks). Switch models on the fly if the first pass is below your target.

export formats can run on any of STT.ai's 10+ models — STT.ai Enhanced (most accurate), Whisper Large V3 (99 languages), NVIDIA Canary (#1 WER on supported langs), Whisper Turbo (fast), Moonshine (lightweight), and more.

Yes. Every transcript exports as SRT or VTT — works with YouTube, Vimeo, TikTok, VLC, and every major video player. The burn-subtitles tool overlays them onto video as hardsubs.

Yes. Speaker diarization automatically labels each voice (Speaker 1, Speaker 2, ...) and you can rename them in the built-in editor. Works across all models and languages.

Most export formats jobs finish in under 5 minutes. A 1-hour audio file typically completes in 2-3 minutes with our fastest models. Speed depends on chosen model and current GPU load.

export formats accepts 20+ formats — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and more. Output to TXT, SRT, VTT, DOCX, JSON, or PDF.

Yes. Audio files submitted to export formats are processed and deleted by default. Pro plans add client-side encryption — even if STT.ai's database is breached, your transcripts are unreadable without your key. Data is never used for model training without explicit opt-in.

Yes. STT.ai offers a REST API with Python and Node.js SDKs, plus an MCP server for Claude and Cursor — all usable for export formats workflows. Free API tier includes 100 minutes/month.

Yes. Every transcript opens in the built-in editor where you can correct words, rename speakers, adjust timestamps, and add notes. All changes save automatically.

Every transcript gets a unique shareable URL. Export to DOCX or PDF for email. Pro plans add password-protected and permanent links — useful for client work.

STT.ai handles 1,300+ platforms including YouTube, Vimeo, TikTok, SoundCloud, Zoom, Google Meet, podcast hosts, and more. URL transcription works with publicly-available content only — DRM-protected sources can't be transcribed.