Ferramenta de transcrição online gratuita
Envie um arquivo, grave pelo microfone ou cole uma URL. A IA transcreve em segundos.
100+ idiomas
Detecção automática ou seleção manual. Todos os principais idiomas suportados.
Detecção de falantes
Identifica automaticamente quem disse o quê.
Criptografia do lado do cliente
Criptografe transcrições no navegador. Nem nós podemos lê-las.
6 formatos de exportação
TXT, SRT, VTT, DOCX, JSON, PDF.
Formatos de áudio e vídeo suportados
Envie arquivos de até 2GB. Suportamos mais de 1.300 plataformas — basta colar a URL. Ver todas as plataformas →
Funciona com áudio e vídeo disponível publicamente. O conteúdo protegido por DRM não é suportado.
Como funciona
1
Envie ou grave
Envie um arquivo de áudio/vídeo, cole uma URL do YouTube ou qualquer plataforma, ou grave pelo microfone.
2
A IA transcreve
Escolha entre vários modelos de IA. Detecção automática de idioma. A diarização identifica quem disse o quê.
3
Exporte e compartilhe
Baixe como TXT, SRT, VTT, DOCX, JSON ou PDF. Compartilhe com um link. Melhore com IA para maior precisão.
Perguntas Frequentes
Carregue o seu arquivo de áudio ou vídeo para STT.ai, cole uma URL ou grava ao vivo. Selecione o seu modelo preferido de IA e clique em Transcrição. A maioria dos arquivos completa em menos de 5 minutos. Exportar como TXT, SRT, VTT, DOCX, JSON ou PDF.
Sim — STT.ai dá a cada visitante 600 minutos livres/mes sem inscrição necessária para o seu primeiro arquivo. Planos pagos a partir de 5 dólares/mes desbloquear arquivos mais longos, transcrições privadas e filas de prioridade.
A precisão depende do modelo e da qualidade do áudio. Nossos melhores modelos atingem uma taxa de erro de 3-5% em índices de referência — 95-97% de precisão na fala limpa. A ferramenta compar-stt permite executar múltiplos modelos no mesmo arquivo e escolher a melhor.
STT.ai oferece 10+ modelos — STT.ai Melhorados (nossos mais precisos), Whisper Large V3 (99 idiomas), NVIDIA Canary (#1 WER em langs suportados), Whisper Turbo (rápido), Moonshine (lightweight), e muito mais. Cada página de modelo tem detalhes.
Sim. Exporte sua transcrição como arquivos de subtítulos SRT ou VTT — eles funcionam com YouTube, Vimeo, TikTok, VLC, e todos os principais reprodutores de vídeo. A ferramenta queima-subtítulos sobrepõe-os ao vídeo como hardsubs.
Sim. Diarização de falantes automaticamente etiqueta cada voz (Alvo 1, falante 2,...) e você pode renomeá-las no editor. Funciona em todos os modelos e idiomas.
A maioria dos arquivos são transcritos em menos de 5 minutos. Um arquivo de áudio de 1 hora geralmente termina em 2-3 minutos com os nossos modelos mais rápidos. A velocidade depende da escolha do modelo e da carga atual.
STT.ai suporta 20+ formatos de entrada — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI e outros. Saída para TXT, SRT, VTT, DOCX, JSON e PDF.
Sim. Os arquivos de áudio são processados e excluídos por padrão. Pro planos adicionar criptografia do lado do cliente — mesmo que o nosso banco de dados seja violado, suas transcrições são ilegíveis sem sua chave. Os dados nunca são usados para o treinamento do modelo sem opt-in explícito.
Sim. STT.ai oferece uma API REST com Python e Node.js SDKs, mais um servidor MCP para Claude e Cursor. O nível de API grátis inclui 100 minutos/mês.
Sim. Cada transcrição abre no nosso editor incorporado onde você pode corrigir palavras, renomear alto-falantes, ajustar selos de tempo e adicionar notas. Todas as alterações salvem automaticamente.
Cada transcrição recebe uma URL compartilhável única. Exportar para DOCX ou PDF para e-mail. Pro planos adicionar links protegidos por senha e permanentes — útil para o trabalho do cliente.
STT.ai suporta 1.300+ plataformas, incluindo YouTube, Vimeo, TikTok, SoundCloud, e muito mais. a transcrição de URLs funciona apenas com conteúdo disponível publicamente — fontes protegidas pelo DRM não podem ser transcritas.