Segnala bug / richiesta di funzionalità

Trascrive con Whisper Large V3

Funziona con audio e video pubblicamente disponibili. I contenuti protetti da DRM non sono supportati.

Aggiornamento per Enhanced

Trascrizione privata

Parlare con la trascrizione

Sblocca con Pro →

Rilascia il file qui o fai clic per navigare

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM fino a 2GB

Caricamento batch di file multipli con Pro

Aggiornamento per Enhanced

Trascrizione privata

Parlare con la trascrizione

Sblocca con Pro →

Aggiornamento per Enhanced

Discorso in tempo reale al testo. AI auto-corregge mentre si parla di precisione di galattosio migliora con il discorso più lungo.

Prova prima il microfono

10 minuti/giorno gratuiti 600 min gratis con iscrizione Nessuna carta di credito Cifrato

Iscriviti gratis →

4.2%

WER

99

Lingue

8.0x

Velocità

MIT

Licenza

Informazioni Whisper Large V3

Whisper Large V3 è l'ammiraglio modello di riconoscimento vocale open-source di OpenAI. Con 1,55 miliardi di parametri, offre una precisione eccezionale in 99 lingue. Utilizza un'architettura encoder-decoder trasformatore addestrato su 680.000 ore di dati audio multilingue.

Lingue supportate da Whisper Large V3

Inglese

Spagnolo

Francese

Tedesco

Cinese

Giapponese

Coreano

Portoghese

Arabo

Hindi

Russo

Italiano

Olandese

Turco

Polacco

Svedese

Indonesiano

Thailandese

Vietnamita

Ceco

Greco

Rumeno

Ungherese

Ebraico

Danese

Finlandese

Norvegese

Ucraino

Malese

Bengalese

Informazioni sul modello

FornitoreOpenAI
Architettura-
LicenzaMIT
AggiornatoMar 2026

Modelli correlati

STT.ai Enhanced

NVIDIA Parakeet

Domande frequenti

Whisper Large V3 è un modello speech-to-text di OpenAI. STT.ai ospita Whisper Large V3 sulla nostra infrastruttura GPU in modo da poterlo utilizzare senza fornire il proprio hardware Hoppenstedt caricare audio o video e scegliere Whisper Large V3 dal picker modello.

Sui benchmark standard, Whisper Large V3 raggiunge circa 4.2% Word Error Rate. L'accuratezza del mondo reale dipende dalla qualità audio, dall'accento e dal linguaggio; per le registrazioni rumorose o accentuate, aspettatevi qualche punto percentuale più alto WER.

Whisper Large V3 funziona su STT.ai di livello libero molto di più ogni visitatore ottiene 600 minuti per iniziare senza alcun costo. I piani a pagamento aggiungono limiti più lunghi per file, trascrizioni private, e la coda di priorità.

Whisper Large V3 è rilasciato sotto MIT, una licenza open-source permissiva. È possibile auto-host Whisper Large V3 sul proprio hardware o utilizzare la nostra versione hosted entrambi sono commercialmente utilizzabili.

Whisper Large V3 supporta 99 lingue. Rilevamento automatico sceglie la lingua giusta per la maggior parte dell'audio; è anche possibile specificarlo manualmente per un piccolo sollevamento di precisione.

Whisper Large V3 elabora audio a circa 8.0x in tempo reale sulle nostre GPU. Un file audio di 1 ora termina in meno di 7 minuti; file più lunghi coda e notifica per e-mail quando fatto.

Whisper Large V3 ha 1.55B parametri. I modelli più grandi tendono ad essere più precisi ma più lenti; STT.ai host Whisper Large V3 su GPU in modo che il conteggio dei parametri non influisca sulle prestazioni lato client.

Whisper Large V3 accetta ogni formato STT.ai supporta © MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, e altri. Uscita come TXT, SRT, VTT, DOCX, JSON, o PDF.

Sì. La diarizzazione degli altoparlanti corre accanto a Whisper Large V3 per ogni trascrizione ogni altoparlante è etichettato e si può rinominare in seguito nell'editor.

Sì. Whisper Large V3 è eseguito nel nostro ambiente gestito L'audio è elaborato e cancellato per impostazione predefinita e mai utilizzato per l'allenamento senza esplicito opt-in. Piani Pro aggiungere la crittografia lato client per le trascrizioni a riposo.

Utilizzare lo strumento di confronto-stt per eseguire Whisper Large V3 contro qualsiasi altro modello supportato sullo stesso audio. Vedrete WER, conteggio dei segmenti, etichette degli altoparlanti e punteggi di confidenza fianco a fianco. Il confronto Whisper Large V3 vs Whisper Large V3 è il più comunemente eseguito.

Sì. Specificare "whisper-large-v3" come parametro del modello sull'endpoint /v1/transcribe. Gli SDK Python e Node.js includono Whisper Large V3 esempi. Il livello API gratuito include 100 minuti/mese.

Sì. Poiché Whisper Large V3 è MIT-licensed, si può auto-ospitare esso. STT.ai pagina open-source elenca il progetto repo e pesi. La maggior parte dei team di produzione utilizzano la nostra versione ospitata per saltare GPU approvvigionamento, modelli di swap, e op.