Segnala bug / richiesta di funzionalità

Trascrive con STT.ai Enhanced

Funziona con audio e video pubblicamente disponibili. I contenuti protetti da DRM non sono supportati.

Aggiornamento per Enhanced

Trascrizione privata

Parlare con la trascrizione

Sblocca con Pro →

Rilascia il file qui o fai clic per navigare

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM fino a 2GB

Caricamento batch di file multipli con Pro

Aggiornamento per Enhanced

Trascrizione privata

Parlare con la trascrizione

Sblocca con Pro →

Aggiornamento per Enhanced

Discorso in tempo reale al testo. AI auto-corregge mentre si parla di precisione di galattosio migliora con il discorso più lungo.

Prova prima il microfono

10 minuti/giorno gratuiti 600 min gratis con iscrizione Nessuna carta di credito Cifrato

Iscriviti gratis →

3.2%

WER

100

Lingue

160.0x

Velocità

Proprietary

Licenza

Informazioni STT.ai Enhanced

STT.ai Enhanced è il nostro modello speech-to-text più preciso e veloce. Costruito su un'architettura di trasformatori all'avanguardia con ottimizzazioni proprietarie, offre velocità di errore di parola leader nel settore in oltre 100 lingue. Ideale per la trascrizione di produzione, la didascalia in tempo reale e applicazioni aziendali.

Lingue supportate da STT.ai Enhanced

Inglese

Spagnolo

Francese

Tedesco

Cinese

Giapponese

Coreano

Portoghese

Arabo

Hindi

Russo

Italiano

Olandese

Turco

Polacco

Svedese

Indonesiano

Thailandese

Vietnamita

Ceco

Greco

Rumeno

Ungherese

Ebraico

Danese

Finlandese

Norvegese

Ucraino

Malese

Bengalese

✦ Sblocca il modello migliorato

Ottieni accesso al nostro modello più accurato con qualsiasi piano a pagamento. 3,2% WER, 160x velocità in tempo reale, 100+ lingue.

Visualizza Piani →

o iscriverti gratuitamente

Informazioni sul modello

FornitoreSTT.ai
Architettura-
LicenzaProprietary
AggiornatoMar 2026

Modelli correlati

Whisper Large V3

NVIDIA Parakeet

Domande frequenti

STT.ai Enhanced è un modello speech-to-text di STT.ai. STT.ai ospita STT.ai Enhanced sulla nostra infrastruttura GPU in modo da poterlo utilizzare senza fornire il proprio hardware Hoppenstedt caricare audio o video e scegliere STT.ai Enhanced dal picker modello.

Sui benchmark standard, STT.ai Enhanced raggiunge circa 3.2% Word Error Rate. L'accuratezza del mondo reale dipende dalla qualità audio, dall'accento e dal linguaggio; per le registrazioni rumorose o accentuate, aspettatevi qualche punto percentuale più alto WER.

STT.ai Enhanced è un modello premium incluso con qualsiasi piano pagato STT.ai a partire da $5/mese. Gli utenti gratuiti possono visualizzare in anteprima STT.ai Enhanced su brevi clip; file più lunghi richiedono un piano attivo.

STT.ai Enhanced è distribuito sotto Proprietary. STT.ai versione ospitata gestisce la conformità di licenza per voi in modo da uso commerciale attraverso il nostro servizio è semplice.

STT.ai Enhanced supporta 100 lingue. Rilevamento automatico sceglie la lingua giusta per la maggior parte dell'audio; è anche possibile specificarlo manualmente per un piccolo sollevamento di precisione.

STT.ai Enhanced elabora audio a circa 160.0x in tempo reale sulle nostre GPU. Un file audio di 1 ora termina in meno di 1 minuti; file più lunghi coda e notifica per e-mail quando fatto.

STT.ai Enhanced ha 1.5B parametri. I modelli più grandi tendono ad essere più precisi ma più lenti; STT.ai host STT.ai Enhanced su GPU in modo che il conteggio dei parametri non influisca sulle prestazioni lato client.

STT.ai Enhanced accetta ogni formato STT.ai supporta © MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, e altri. Uscita come TXT, SRT, VTT, DOCX, JSON, o PDF.

Sì. La diarizzazione degli altoparlanti corre accanto a STT.ai Enhanced per ogni trascrizione ogni altoparlante è etichettato e si può rinominare in seguito nell'editor.

Sì. STT.ai Enhanced è eseguito nella nostra infrastruttura privata L'audio è elaborato e cancellato per impostazione predefinita. Pro+ aggiunge crittografia lato client in modo che le trascrizioni sono illeggibili senza la tua chiave, e Private Cloud consente di auto-host STT.ai Enhanced interamente nel proprio VPC.

Utilizzare lo strumento di confronto-stt per eseguire STT.ai Enhanced contro qualsiasi altro modello supportato sullo stesso audio. Vedrete WER, conteggio dei segmenti, etichette degli altoparlanti e punteggi di confidenza fianco a fianco. Il confronto STT.ai Enhanced vs Whisper Large V3 è il più comunemente eseguito.

Sì. Specificare "stt-ai-enhanced" come parametro del modello sull'endpoint /v1/transcribe. Gli SDK Python e Node.js includono STT.ai Enhanced esempi. Il livello API gratuito include 100 minuti/mese.

Licensing per STT.ai Enhanced è impostato da STT.ai; self-hosting dipende dai loro termini. STT.ai servizio ospitato funziona STT.ai Enhanced sulla GPU gestito in modo da non è necessario gestire tale integrazione.