Informar de Bug / Pedido de Feature

Transcrição com Whisper Turbo

Name: Whisper Turbo
Author: OpenAI

Funciona com áudio e vídeo disponível publicamente. O conteúdo protegido por DRM não é suportado.

Atualização para Melhorado

Transcrição privada

Conversa com transcrição

Desbloquear com Pro →

Deixe aqui o arquivo ou clique para navegar

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — até 2GB

Lote de upload múltiplos arquivos com Pro

Atualização para Melhorado

Transcrição privada

Conversa com transcrição

Desbloquear com Pro →

Atualização para Melhorado

A fala em tempo real ao texto. A IA auto-correge ao mesmo tempo que você fala — a precisão melhora com a fala mais longa.

Teste o seu microfone primeiro

10 min/dia livre 600 min livre com inscrição Não há cartão de crédito Cifrado

Inscrever-se gratuitamente →

5.1%

WER

Línguas

32.0x

Velocidade

MIT

Licença

Sobre Whisper Turbo

O Whisper Turbo (large-v3-turbo) é uma versão destilada do Whisper Large V3 que reduz dramaticamente o tempo de inferência, mantendo a precisão competitiva. Com apenas 4 camadas de decodificador em vez de 32, atinge uma velocidade de 4x.

Línguas Suportadas por Whisper Turbo

Inglês

Espanhol

Francês

Alemão

Chinês

Japonês

Coreano

Português

Árabe

Híndi

Russo

Italiano

Holandês

Turco

Polonês

Sueco

Indonésio

Tailandês

Vietnamita

Tcheco

Grego

Romeno

Húngaro

Hebraico

Dinamarquês

Finlandês

Norueguês

Ucraniano

Malaio

Bengali

Informações do Modelo

FornecedorOpenAI
Arquitetura-
LicençaMIT
ActualizadoMar 2026

Modelos Relacionados

3.2% WER

4.2% WER

3.5% WER

7.8% WER

3.0% WER

Perguntas frequentes

Whisper Turbo é um modelo de fala a texto por OpenAI. STT.ai hospeda Whisper Turbo em nossa infraestrutura GPU para que você possa usá-lo sem providenciar seu próprio hardware — carregar áudio ou vídeo e escolher Whisper Turbo do seletor de modelos.

Nas referências padrão, Whisper Turbo atinge cerca de 8801% da taxa de erro do Word. A precisão do mundo real depende da qualidade, acento e linguagem do áudio; para gravações ruidosas ou acentuadas, esperam alguns pontos percentuais mais altos WER.

Whisper Turbo corre na nível livre de STT.ai — cada visitante recebe 600 minutos para começar sem custo. Planos pagos adicionam mais limites por arquivo, transcrições privadas e filas de espera prioritárias.

Whisper Turbo é lançado sob MIT, uma licença permissiva de código aberto. Você pode auto-hoste Whisper Turbo em seu próprio hardware ou usar a nossa versão hospedada — ambos são comercialmente utilizáveis.

Whisper Turbo suporta 99 idiomas. Auto-detecção escolhe a linguagem certa para a maioria do áudio; você também pode especificar manualmente para um pequeno elevador de precisão.

Whisper Turbo processa áudio a cerca de 32.0x em tempo real em nosso GPUs. Um arquivo de áudio de 1 hora termina em menos de 1 minutos; arquivos mais longos cola e notifica por e-mail quando feito.

Whisper Turbo tem 809M parâmetros. Os modelos mais grandes tendem a ser mais precisos mas mais lentos; STT.ai hosts Whisper Turbo na GPU para que a contagem de parâmetros não afecte o seu desempenho do lado do cliente.

Whisper Turbo aceita cada formato STT.ai suportes — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI e outros. Saída como TXT, SRT, VTT, DOCX, JSON ou PDF.

Sim. Diarização do orador corre ao lado de Whisper Turbo para cada transcrição — cada orador é rotulado e você pode renomeá-los no editor depois.

Sim. Whisper Turbo funciona no nosso ambiente gerenciado — áudio é processado e excluído por padrão e nunca usado para treinamento sem opt-in explícito. Pro planos adicionar criptografia do lado do cliente para transcrições no repouso.

Use a ferramenta compar-stt para executar Whisper Turbo contra qualquer outro modelo suportado no mesmo áudio — você verá WER, contagem de segmentos, rótulos de alto-falante e pontuação de confiança lado a lado. A comparação Whisper Turbo vs Whisper Large V3 é a mais comumente executada.

Sim. Especifique "whisper-turbo" como o parâmetro do modelo no ponto final /v1/transcribe. Python e Node.js SDKs incluem Whisper Turbo exemplos. O nível de API gratuito inclui 100 minutos/mes.

Sim. Como Whisper Turbo é MIT-licenciado, você pode hospedá-lo. STT.ai página de código aberto lista o projeto repo e pesos. A maioria das equipes de produção usa a nossa versão hospedada para saltar compras GPU, swaps de modelos e ops.

Transcrição com Whisper Turbo

Sobre Whisper Turbo

Línguas Suportadas por Whisper Turbo

Informações do Modelo

Modelos Relacionados

Perguntas frequentes

O que é Whisper Turbo?

Quão precisas são Whisper Turbo?

Whisper Turbo é livre de usar?

Que licença usa Whisper Turbo?

Quantas línguas apoiam Whisper Turbo?

Quão rápido é Whisper Turbo?

Quão grande é o modelo Whisper Turbo?

Que formatos de áudio podem transcrever Whisper Turbo?

Whisper Turbo detecta múltiplos alto-falantes?

Os meus dados são privados quando usam Whisper Turbo?

Como se compara Whisper Turbo com outros modelos STT?

Posso usar Whisper Turbo através da API?

Posso executar Whisper Turbo no meu próprio servidor?