Transcrever com STT.ai Enhanced

Funciona com áudio e vídeo disponível publicamente. O conteúdo protegido por DRM não é suportado.

Atualização para Melhorado
Private transcript
Conversa com transcrição
Desbloquear com Pro →
Deixe aqui o arquivo ou clique para navegar
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — até 2GB
Atualização para Melhorado
Private transcript
Conversa com transcrição
Desbloquear com Pro →
Atualização para Melhorado
Gravação: 0:00
Em tempo real Vosk (instante)
Melhorado Whisper (exacto)
Ligações públicas: 24h, texto apenas · Inscrever-se para 7d + áudio · Pro para as ligações privadas

A fala em tempo real ao texto. A IA auto-correge ao mesmo tempo que você fala — a precisão melhora com a fala mais longa.

Teste o seu microfone primeiro
❤️ Diz aos teus amigos!
Usaste as transcrições livres.

Inscreva-se gratuitamente para obter 600 minutos/mes, ou atualização para transcrições ilimitadas.

10 min/dia livre 600 min livre com inscrição Não há cartão de crédito Cifrado
Inscrever-se gratuitamente →
3.2%
WER
100
Languages
160.0x
Speed
Proprietary
License

Sobre STT.ai Enhanced

STT.ai Enhanced is our most accurate and fastest speech-to-text model. Built on cutting-edge transformer architecture with proprietary optimizations, it delivers industry-leading word error rates across 100+ languages. Ideal for production transcription, real-time captioning, and enterprise applications.
✦ Unlock Enhanced Model

Get access to our most accurate model with any paid plan. 3.2% WER, 160x real-time speed, 100+ languages.

View Plans →
Model Info
  • ProviderSTT.ai
  • Architecture-
  • LicenseProprietary
  • UpdatedMar 2026

Perguntas frequentes

STT.ai Enhanced é um modelo de fala a texto por STT.ai. STT.ai hospeda STT.ai Enhanced em nossa infraestrutura GPU para que você possa usá-lo sem providenciar seu próprio hardware — carregar áudio ou vídeo e escolher STT.ai Enhanced do seletor de modelos.

Nas referências padrão, STT.ai Enhanced atinge cerca de 8801% da taxa de erro do Word. A precisão do mundo real depende da qualidade, acento e linguagem do áudio; para gravações ruidosas ou acentuadas, esperam alguns pontos percentuais mais altos WER.

STT.ai Enhanced é um modelo premium — incluído com qualquer plano de STT.ai pagos a partir de $5/mês. Os usuários gratuitos podem visualizar STT.ai Enhanced em clipes curtos; arquivos mais longos requerem um plano ativo.

STT.ai Enhanced é distribuído abaixo de Proprietary. A versão hospedada de STT.ai lida com a conformidade de licença para você, portanto, uso comercial através do nosso serviço é simples.

STT.ai Enhanced suporta 100 idiomas. Auto-detecção escolhe a linguagem certa para a maioria do áudio; você também pode especificar manualmente para um pequeno elevador de precisão.

STT.ai Enhanced processa áudio a cerca de 160.0x em tempo real em nosso GPUs. Um arquivo de áudio de 1 hora termina em menos de 1 minutos; arquivos mais longos cola e notifica por e-mail quando feito.

STT.ai Enhanced tem 1.5B parâmetros. Os modelos mais grandes tendem a ser mais precisos mas mais lentos; STT.ai hosts STT.ai Enhanced na GPU para que a contagem de parâmetros não afecte o seu desempenho do lado do cliente.

STT.ai Enhanced aceita cada formato STT.ai suportes — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI e outros. Saída como TXT, SRT, VTT, DOCX, JSON ou PDF.

Sim. Diarização do orador corre ao lado de STT.ai Enhanced para cada transcrição — cada orador é rotulado e você pode renomeá-los no editor depois.

Sim. STT.ai Enhanced funciona em nossa infraestrutura privada — áudio é processado e excluído por padrão. Pro+ adiciona criptografia do lado do cliente para que as transcrições são ilegíveis sem sua chave, e o Private Cloud permite que você auto-hoste STT.ai Enhanced inteiramente em seu próprio VPC.

Use a ferramenta compar-stt para executar STT.ai Enhanced contra qualquer outro modelo suportado no mesmo áudio — você verá WER, contagem de segmentos, rótulos de alto-falante e pontuação de confiança lado a lado. A comparação STT.ai Enhanced vs Whisper Large V3 é a mais comumente executada.

Sim. Especifique "stt-ai-enhanced" como o parâmetro do modelo no ponto final /v1/transcribe. Python e Node.js SDKs incluem STT.ai Enhanced exemplos. O nível de API gratuito inclui 100 minutos/mes.

O licenciamento para STT.ai Enhanced é definido por STT.ai; o auto-hosting depende de seus termos. O serviço hospedado STT.ai é executado STT.ai Enhanced em GPU gerenciado para que você não precise lidar com essa integração.