Segnala bug / richiesta di funzionalità

Trascrive con NVIDIA Canary

Funziona con audio e video pubblicamente disponibili. I contenuti protetti da DRM non sono supportati.

Aggiornamento per Enhanced

Trascrizione privata

Parlare con la trascrizione

Sblocca con Pro →

Rilascia il file qui o fai clic per navigare

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM fino a 2GB

Caricamento batch di file multipli con Pro

Aggiornamento per Enhanced

Trascrizione privata

Parlare con la trascrizione

Sblocca con Pro →

Aggiornamento per Enhanced

Discorso in tempo reale al testo. AI auto-corregge mentre si parla di precisione di galattosio migliora con il discorso più lungo.

Prova prima il microfono

10 minuti/giorno gratuiti 600 min gratis con iscrizione Nessuna carta di credito Cifrato

Iscriviti gratis →

3.5%

WER

4

Lingue

45.0x

Velocità

CC-BY-4.0

Licenza

Informazioni NVIDIA Canary

NVIDIA Canary è un modello di parametri 1B che eccelle alla trascrizione inglese, tedesco, francese e spagnolo. Costruito sul framework NeMo, utilizza un encoder FastConformer con un decodificatore di trasformatori e supporta il rilevamento automatico della lingua e la traduzione.

Lingue supportate da NVIDIA Canary

Inglese

Spagnolo

Francese

Tedesco

Informazioni sul modello

FornitoreNVIDIA
Architettura-
LicenzaCC-BY-4.0
AggiornatoMar 2026

Modelli correlati

STT.ai Enhanced

Whisper Large V3

NVIDIA Parakeet

Domande frequenti

NVIDIA Canary è un modello speech-to-text di NVIDIA. STT.ai ospita NVIDIA Canary sulla nostra infrastruttura GPU in modo da poterlo utilizzare senza fornire il proprio hardware Hoppenstedt caricare audio o video e scegliere NVIDIA Canary dal picker modello.

Sui benchmark standard, NVIDIA Canary raggiunge circa 3.5% Word Error Rate. L'accuratezza del mondo reale dipende dalla qualità audio, dall'accento e dal linguaggio; per le registrazioni rumorose o accentuate, aspettatevi qualche punto percentuale più alto WER.

NVIDIA Canary funziona su STT.ai di livello libero molto di più ogni visitatore ottiene 600 minuti per iniziare senza alcun costo. I piani a pagamento aggiungono limiti più lunghi per file, trascrizioni private, e la coda di priorità.

NVIDIA Canary è rilasciato sotto CC-BY-4.0, una licenza open-source permissiva. È possibile auto-host NVIDIA Canary sul proprio hardware o utilizzare la nostra versione hosted entrambi sono commercialmente utilizzabili.

NVIDIA Canary supporta 4 lingue. Rilevamento automatico sceglie la lingua giusta per la maggior parte dell'audio; è anche possibile specificarlo manualmente per un piccolo sollevamento di precisione.

NVIDIA Canary elabora audio a circa 45.0x in tempo reale sulle nostre GPU. Un file audio di 1 ora termina in meno di 1 minuti; file più lunghi coda e notifica per e-mail quando fatto.

NVIDIA Canary ha 1B parametri. I modelli più grandi tendono ad essere più precisi ma più lenti; STT.ai host NVIDIA Canary su GPU in modo che il conteggio dei parametri non influisca sulle prestazioni lato client.

NVIDIA Canary accetta ogni formato STT.ai supporta © MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, e altri. Uscita come TXT, SRT, VTT, DOCX, JSON, o PDF.

Sì. La diarizzazione degli altoparlanti corre accanto a NVIDIA Canary per ogni trascrizione ogni altoparlante è etichettato e si può rinominare in seguito nell'editor.

Sì. NVIDIA Canary è eseguito nel nostro ambiente gestito L'audio è elaborato e cancellato per impostazione predefinita e mai utilizzato per l'allenamento senza esplicito opt-in. Piani Pro aggiungere la crittografia lato client per le trascrizioni a riposo.

Utilizzare lo strumento di confronto-stt per eseguire NVIDIA Canary contro qualsiasi altro modello supportato sullo stesso audio. Vedrete WER, conteggio dei segmenti, etichette degli altoparlanti e punteggi di confidenza fianco a fianco. Il confronto NVIDIA Canary vs Whisper Large V3 è il più comunemente eseguito.

Sì. Specificare "nvidia-canary" come parametro del modello sull'endpoint /v1/transcribe. Gli SDK Python e Node.js includono NVIDIA Canary esempi. Il livello API gratuito include 100 minuti/mese.

Sì. Poiché NVIDIA Canary è CC-BY-4.0-licensed, si può auto-ospitare esso. STT.ai pagina open-source elenca il progetto repo e pesi. La maggior parte dei team di produzione utilizzano la nostra versione ospitata per saltare GPU approvvigionamento, modelli di swap, e op.