Informar dun erro / Solicitar unha funcionalidade

Transcrever con Whisper Turbo

Name: Whisper Turbo
Author: OpenAI

Funciona con son e vídeo dispoñíbeis publicamente. Non se admiten contidos protexidos con DRM.

Actualización para mellorado

Transcrición privada

Conversa con transcrición

Desbloquear con Pro →

Solte aquí o ficheiro ou prema para examinar

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — ata 2 GB

Enviar varios ficheiros en lote con Pro

Actualización para mellorado

Transcrición privada

Conversa con transcrición

Desbloquear con Pro →

Actualización para mellorado

Fala a texto en tempo real. A IA corrixe automaticamente mentres fala — a precisión mellora coa duración da fala.

Probe primeiro o micrófono

10 minutos libres/día 600 min gratis con rexistro Sen tarxeta de crédito Cifrado

Inscríbete gratis →

5.1%

WER

Linguas

32.0x

Velocidade

MIT

Licenza

Acerca de Whisper Turbo

Whisper Turbo (large- v3- turbo) é unha versión destilada de Whisper Large V3 que reduce drasticamente o tempo de inferencia mantendo a precisión competitiva. Con só 4 capas de descodificador no canto de 32, consegue unha velocidade 4x maior.

Linguas soportadas Whisper Turbo

Inglés

Español

Francés

Alemán

Chinés

Xaponés

Coreano

Portugués

Árabe

Hindi

Ruso

Italiano

Neerlandés

Turco

Polaco

Sueco

Indonesio

Tailandés

Vietnamita

Checo

Grego

Romanés

Húngaro

Hebreo

Dinamarqués

Finés

Noruegués

Ucraíno

Malaio

Bengalí

Información do modelo

ProvedorOpenAI
Arquitectura-
LicenzaMIT
ActualizadoMar 2026

Modelos relacionados

3.2% WER

4.2% WER

3.5% WER

7.8% WER

3.0% WER

Preguntas frecuentes

Whisper Turbo é un modelo de voz a texto de OpenAI. STT.ai aloxa Whisper Turbo na nosa infraestrutura de GPU para que poida usalo sen ter que aprovisionar o seu propio hardware: envíe son ou vídeo e escolla Whisper Turbo no selector de modelos.

En probas estándar, Whisper Turbo alcanza unha taxa de erro de palabra do 5.1%. A precisión real depende da calidade do son, do acento e da linguaxe; para gravacións ruidosas ou acentuadas, espere uns poucos puntos porcentuais máis altos de WER.

Whisper Turbo executa no nivel gratuíto de STT.ai - cada visitante obtén 600 minutos para comezar sen custo. Os plans de pago engaden límites máis longos por ficheiro, transcricións privadas e filas de prioridade.

Whisper Turbo é publicado baixo MIT, unha licenza permisiva de código aberto. Pode aloxar Whisper Turbo no seu propio hardware ou usar a nosa versión aloxada, ambas as dúas son comercialmente utilizables.

Whisper Turbo soporta 99 linguas. A detección automática escolle a lingua correcta para a maioría do son; tamén pode especificala manualmente para un pequeno aumento de precisión.

Whisper Turbo procesa o son a uns 32.0x en tempo real nas nosas GPU. Un ficheiro de son de 1 hora remata en menos de 1 minutos; os ficheiros máis longos enfróntanse e avísanse por correo electrónico cando rematan.

Whisper Turbo ten parámetros 809M. Os modelos maiores tenden a ser máis precisos pero máis lentos; STT.ai aloxa Whisper Turbo na GPU polo que a contaxe de parámetros non afecta ao rendemento do lado do cliente.

Whisper Turbo acepta todos os formatos soportados por STT.ai: MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI e outros. Saída como TXT, SRT, VTT, DOCX, JSON ou PDF.

Si. A diarización do falante corre xunto co Whisper Turbo para cada transcrición - cada falante está etiquetado e pode mudarlle o nome no editor despois.

Si. Whisper Turbo executase no noso entorno xestionado — o son é procesado e borrado por omisión e nunca é usado para adestramento sen unha opción explícita. Os plans Pro engadirán cifrado do lado do cliente para as transcricións en repouso.

Use a ferramenta compare- stt para executar o Whisper Turbo contra calquera outro modelo soportado no mesmo son — verá o WER, o número de segmentos, as etiquetas dos altofalantes e as puntuacións de confianza lado a lado. A comparación Whisper Turbo vs Whisper Large V3 é a máis común.

Si. Especifique « whisper-turbo » como parámetro do modelo no punto final / v1/ transcribe. Os SDK de Python e Node. js inclúen exemplos de Whisper Turbo. O nivel de API gratuíto inclúe 100 minutos/ mes.

Si. Como Whisper Turbo ten licenza MIT, pode aloxalo vostede mesmo. A páxina de código aberto de STT.ai lista o repositorio e os pesos do proxecto. A maioría dos equipos de produción usan a nosa versión aloxada para saltar a procura de GPU, intercambios de modelos e operacións.

Transcrever con Whisper Turbo

Acerca de Whisper Turbo

Linguas soportadas Whisper Turbo

Información do modelo

Modelos relacionados

Preguntas frecuentes

Que é Whisper Turbo?

Que tan exacto é Whisper Turbo?

É libre o Whisper Turbo?

Que licenza usa Whisper Turbo?

Cantos idiomas soporta Whisper Turbo?

Que tan rápido é Whisper Turbo?

Canto é grande o modelo Whisper Turbo?

Que formatos de son pode transcribir o Whisper Turbo?

O Whisper Turbo detecta varios altofalantes?

Os meus datos son privados cando uso Whisper Turbo?

Como se compara o Whisper Turbo con outros modelos STT?

Podo usar Whisper Turbo a través da API?

Podo executar Whisper Turbo no meu propio servidor?