Transcribe with NVIDIA Canary
3.5%
WER
4
Languages
45.0x
Speed
CC-BY-4.0
License
About NVIDIA Canary
Model Info
- ProviderNVIDIA
- Architecture-
- LicenseCC-BY-4.0
- UpdatedMar 2026
Pyetje të shpeshta
NVIDIA Canary është një model i fjalës në tekst nga NVIDIA. STT.ai mban NVIDIA Canary në infrastrukturën tonë të GPU kështu që mund ta përdorni pa furnizuar hardware-in tuaj — ngarkoni audion ose videon dhe zgjidhni NVIDIA Canary nga zgjedhësi i modelit.
Në standartet e vlerësimit, NVIDIA Canary arrin rreth 3.5% të normave të gabimeve të fjalëve. Saktësia në botën reale varet nga cilësia e audios, theksi dhe gjuha; për regjistrime me zhurmë ose theks, prit disa përqindje më të larta WER.
NVIDIA Canary punon në nivelin e lirë të STT.ai — çdo vizitor merr 600 minuta në muaj pa kosto. Planet e paguar shtojnë kufizime më të gjata për file, transkripta private dhe renditje në radhë me përparësi.
NVIDIA Canary është lëshuar nën CC-BY-4.0, një licencë e hapur e hapur. Mund të vetë-hostoni NVIDIA Canary në hardware-in tuaj ose të përdorni versionin tonë të pritur — të dy janë komercialisht të përdorshëm.
NVIDIA Canary suporton 4 gjuhë. Zbulimi automatik zgjedh gjuhën e duhur për shumicën e audiove; mund ta specifikoni gjithashtu manualisht për një rritje të vogël të saktësisë.
NVIDIA Canary përpunon audion në rreth 45.0x në kohë reale në GPU-të tona. Një file audio 1 orë përfundon në më pak se 1 minuta; file më të gjatë vënë në radhë dhe njoftohen me email kur përfundojnë.
NVIDIA Canary ka parametrat 1B. Modelet më të mëdha priren të jenë më të sakta por më të ngadalshme; STT.ai hosts NVIDIA Canary në GPU kështu që numërimi i parametrave nuk ndikon në performancën e anës së klientit.
NVIDIA Canary pranon çdo format që suporton STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, dhe të tjerë. Shfaq si TXT, SRT, VTT, DOCX, JSON, ose PDF.
Po. Diarization e folësit punon së bashku me NVIDIA Canary për çdo transkriptim - çdo folës është i etiketuar dhe mund t'i riemërtoni ata në editor më pas.
Po. NVIDIA Canary punon në mjedisin tonë të menazhuar — audiot përpunohen dhe eleminohen në mënyrë të prezgjedhur dhe nuk përdoren kurrë për trainim pa opsion të hapur. Planet Pro shtojnë kriptimin në anën e klientit për transkriptat në pushim.
Përdor instrumentin compare-stt për të ekzekutuar NVIDIA Canary kundër çdo modeli tjetër të suportuar në të njëjtin audio — do të shihni WER, numrin e segmenteve, etiketat e folësve dhe rezultatet e besimit krah-për-krah. Krahasimi NVIDIA Canary vs Whisper Large V3 është më i zakonshmi.
Po. Specifiko "nvidia-canary" si parametri i modelit në /v1/transcribe endpoint. Python dhe Node.js SDK përfshijnë shembuj NVIDIA Canary. Niveli i API pa pagesë përfshin 100 minuta në muaj.
Po. Sepse NVIDIA Canary është i licencuar CC-BY-4.0, mund ta hostosh vetë. Faqja e burimit të hapur të STT.ai-ës përmban listën e projektit dhe peshat. Shumica e ekipeve të prodhimit përdorin versionin tonë të pritur për të kaluar GPU-në, modelin e shkëmbimit dhe operacionet.