Informar dun erro / Solicitar unha funcionalidade

Transcrever con STT.ai Enhanced

Name: STT.ai Enhanced
Author: STT.ai

Funciona con son e vídeo dispoñíbeis publicamente. Non se admiten contidos protexidos con DRM.

Actualización para mellorado

Transcrición privada

Conversa con transcrición

Desbloquear con Pro →

Solte aquí o ficheiro ou prema para examinar

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — ata 2 GB

Enviar varios ficheiros en lote con Pro

Actualización para mellorado

Transcrición privada

Conversa con transcrición

Desbloquear con Pro →

Actualización para mellorado

Fala a texto en tempo real. A IA corrixe automaticamente mentres fala — a precisión mellora coa duración da fala.

Probe primeiro o micrófono

10 minutos libres/día 600 min gratis con rexistro Sen tarxeta de crédito Cifrado

Inscríbete gratis →

3.2%

WER

100

Linguas

160.0x

Velocidade

Proprietary

Licenza

Acerca de STT.ai Enhanced

STT.ai Enhanced é o noso modelo de voz a texto máis preciso e rápido. Construído sobre unha arquitectura de transformador de vangarda con optimizacións propietarias, ofrece taxas de erro de palabra líderes na industria en máis de 100 linguas. Ideal para transcrición de produción, subtítulos en tempo real e aplicacións empresariais.

Linguas soportadas STT.ai Enhanced

Inglés

Español

Francés

Alemán

Chinés

Xaponés

Coreano

Portugués

Árabe

Hindi

Ruso

Italiano

Neerlandés

Turco

Polaco

Sueco

Indonesio

Tailandés

Vietnamita

Checo

Grego

Romanés

Húngaro

Hebreo

Dinamarqués

Finés

Noruegués

Ucraíno

Malaio

Bengalí

✦ Desbloquear o modelo mellorado

Acceda ao noso modelo máis preciso con calquera plan de pago. 3, 2% WER, 160x velocidade en tempo real, máis de 100 idiomas.

Ver os planos →

ou rexístrese de balde

Información do modelo

ProvedorSTT.ai
Arquitectura-
LicenzaProprietary
ActualizadoMar 2026

Modelos relacionados

4.2% WER

5.1% WER

3.5% WER

7.8% WER

3.0% WER

Preguntas frecuentes

STT.ai Enhanced é un modelo de voz a texto de STT.ai. STT.ai aloxa STT.ai Enhanced na nosa infraestrutura de GPU para que poida usalo sen ter que aprovisionar o seu propio hardware: envíe son ou vídeo e escolla STT.ai Enhanced no selector de modelos.

En probas estándar, STT.ai Enhanced alcanza unha taxa de erro de palabra do 3.2%. A precisión real depende da calidade do son, do acento e da linguaxe; para gravacións ruidosas ou acentuadas, espere uns poucos puntos porcentuais máis altos de WER.

STT.ai Enhanced é un modelo premium — incluído con calquera plan STT.ai de pago a partir de $5/ mes. Os usuarios gratuítos poden previsualizar STT.ai Enhanced en clips curtos; os ficheiros máis longos requiren un plan activo.

STT.ai Enhanced distribúese baixo Proprietary. A versión aloxada de STT.ai xestiona a conformidade da licenza por vostede, polo que o uso comercial a través do noso servizo é sinxelo.

STT.ai Enhanced soporta 100 linguas. A detección automática escolle a lingua correcta para a maioría do son; tamén pode especificala manualmente para un pequeno aumento de precisión.

STT.ai Enhanced procesa o son a uns 160.0x en tempo real nas nosas GPU. Un ficheiro de son de 1 hora remata en menos de 1 minutos; os ficheiros máis longos enfróntanse e avísanse por correo electrónico cando rematan.

STT.ai Enhanced ten parámetros 1.5B. Os modelos maiores tenden a ser máis precisos pero máis lentos; STT.ai aloxa STT.ai Enhanced na GPU polo que a contaxe de parámetros non afecta ao rendemento do lado do cliente.

STT.ai Enhanced acepta todos os formatos soportados por STT.ai: MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI e outros. Saída como TXT, SRT, VTT, DOCX, JSON ou PDF.

Si. A diarización do falante corre xunto co STT.ai Enhanced para cada transcrición - cada falante está etiquetado e pode mudarlle o nome no editor despois.

Si. STT.ai Enhanced executase na nosa infraestrutura privada — o son é procesado e borrado por omisión. Pro+ engade cifrado do lado do cliente para que as transcricións sexan ilegibles sen a súa chave, e Private Cloud permítelle aloxar STT.ai Enhanced completamente na súa propia VPC.

Use a ferramenta compare- stt para executar o STT.ai Enhanced contra calquera outro modelo soportado no mesmo son — verá o WER, o número de segmentos, as etiquetas dos altofalantes e as puntuacións de confianza lado a lado. A comparación STT.ai Enhanced vs Whisper Large V3 é a máis común.

Si. Especifique « stt-ai-enhanced » como parámetro do modelo no punto final / v1/ transcribe. Os SDK de Python e Node. js inclúen exemplos de STT.ai Enhanced. O nivel de API gratuíto inclúe 100 minutos/ mes.

A licenza para STT.ai Enhanced establécea STT.ai; o autoaloxamento depende dos seus termos. O servizo aloxado de STT.ai executa STT.ai Enhanced nunha GPU xestionada, polo que non precisa xestionar esa integración.

Transcrever con STT.ai Enhanced

Acerca de STT.ai Enhanced

Linguas soportadas STT.ai Enhanced

✦ Desbloquear o modelo mellorado

Información do modelo

Modelos relacionados

Preguntas frecuentes

Que é STT.ai Enhanced?

Que tan exacto é STT.ai Enhanced?

É libre o STT.ai Enhanced?

Que licenza usa STT.ai Enhanced?

Cantos idiomas soporta STT.ai Enhanced?

Que tan rápido é STT.ai Enhanced?

Canto é grande o modelo STT.ai Enhanced?

Que formatos de son pode transcribir o STT.ai Enhanced?

O STT.ai Enhanced detecta varios altofalantes?

Os meus datos son privados cando uso STT.ai Enhanced?

Como se compara o STT.ai Enhanced con outros modelos STT?

Podo usar STT.ai Enhanced a través da API?

Podo executar STT.ai Enhanced no meu propio servidor?