Carregue o seu arquivo de áudio ou vídeo para STT.ai, cole uma URL ou grava ao vivo. Selecione o seu modelo preferido de IA e clique em Transcrição. A maioria dos arquivos completa em menos de 5 minutos. Exportar como TXT, SRT, VTT, DOCX, JSON ou PDF.

Sim — STT.ai dá a cada visitante 600 minutos livres/mes sem inscrição necessária para o seu primeiro arquivo. Planos pagos a partir de 5 dólares/mes desbloquear arquivos mais longos, transcrições privadas e filas de prioridade.

A precisão depende do modelo e da qualidade do áudio. Nossos melhores modelos atingem uma taxa de erro de 3-5% em índices de referência — 95-97% de precisão na fala limpa. A ferramenta compar-stt permite executar múltiplos modelos no mesmo arquivo e escolher a melhor.

STT.ai oferece 10+ modelos — STT.ai Melhorados (nossos mais precisos), Whisper Large V3 (99 idiomas), NVIDIA Canary (#1 WER em langs suportados), Whisper Turbo (rápido), Moonshine (lightweight), e muito mais. Cada página de modelo tem detalhes.

Sim. Exporte sua transcrição como arquivos de subtítulos SRT ou VTT — eles funcionam com YouTube, Vimeo, TikTok, VLC, e todos os principais reprodutores de vídeo. A ferramenta queima-subtítulos sobrepõe-os ao vídeo como hardsubs.

Sim. Diarização de falantes automaticamente etiqueta cada voz (Alvo 1, falante 2,...) e você pode renomeá-las no editor. Funciona em todos os modelos e idiomas.

A maioria dos arquivos são transcritos em menos de 5 minutos. Um arquivo de áudio de 1 hora geralmente termina em 2-3 minutos com os nossos modelos mais rápidos. A velocidade depende da escolha do modelo e da carga atual.

STT.ai suporta 20+ formatos de entrada — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI e outros. Saída para TXT, SRT, VTT, DOCX, JSON e PDF.

Sim. Os arquivos de áudio são processados e excluídos por padrão. Pro planos adicionar criptografia do lado do cliente — mesmo que o nosso banco de dados seja violado, suas transcrições são ilegíveis sem sua chave. Os dados nunca são usados para o treinamento do modelo sem opt-in explícito.

Sim. STT.ai oferece uma API REST com Python e Node.js SDKs, mais um servidor MCP para Claude e Cursor. O nível de API grátis inclui 100 minutos/mês.

Sim. Cada transcrição abre no nosso editor incorporado onde você pode corrigir palavras, renomear alto-falantes, ajustar selos de tempo e adicionar notas. Todas as alterações salvem automaticamente.

Cada transcrição recebe uma URL compartilhável única. Exportar para DOCX ou PDF para e-mail. Pro planos adicionar links protegidos por senha e permanentes — útil para o trabalho do cliente.

STT.ai suporta 1.300+ plataformas, incluindo YouTube, Vimeo, TikTok, SoundCloud, e muito mais. a transcrição de URLs funciona apenas com conteúdo disponível publicamente — fontes protegidas pelo DRM não podem ser transcritas.

Ferramenta de transcrição online gratuita

Formatos de áudio e vídeo suportados

Como funciona

Envie ou grave

A IA transcreve

Exporte e compartilhe

Perguntas Frequentes

Como transcribo áudio com STT.ai?

Is STT.ai free?

How accurate is STT.ai's transcription?

What AI models can I use?

Can I get subtitles and captions?

Does STT.ai detect different speakers?

How long does transcription take?

What file formats are supported?

Is my audio data kept private?

Posso aceder à transcrição através da API?

Can I edit the transcript after?

How do I share my transcript?

What URLs and platforms are supported?