Transcribe with NVIDIA Canary
3.5%
WER
4
Languages
45.0x
Speed
CC-BY-4.0
License
About NVIDIA Canary
Model Info
- ProviderNVIDIA
- Architecture-
- LicenseCC-BY-4.0
- UpdatedMar 2026
Maiz egiten diren galderak
NVIDIA Canary NVIDIAren hizketa-testu modelo bat da. STT.aik NVIDIA Canary gure GPU azpiegituran ostatzen du, zure hardwarea hornitu gabe erabil dezakezu, audioa edo bideoa igo eta NVIDIA Canary aukeratu modelo-hautatzailean.
Erreferentzia estandarretan, NVIDIA Canaryk %3.5 inguruko hitzen errore-tasa lortzen du. Benetako zehaztasuna audio-kalitatearen, azentuaren eta hizkuntzaren araberakoa da; grabazio zaratatsu edo azentudunetarako, WER ehuneko puntu batzuk handiagoa espero daiteke.
NVIDIA Canary STT.airen doako mailan exekutatzen da — bisitari bakoitzak 600 minutu/hilabete jasotzen ditu kosturik gabe. Ordainpeko planek fitxategiko muga luzeagoak gehitzen dituzte, transkribapen pribatuak eta lehentasun ilara.
NVIDIA Canary CC-BY-4.0 lizentziapean argitaratzen da, kode irekiko lizentzia permisiboa. Zure hardwarean NVIDIA Canary ostatatu dezakezu edo gure ostatatutako bertsioa erabili — biak erabil daitezke merkataritzan.
NVIDIA Canaryk 4 hizkuntza onartzen ditu. Auto-detekzioak hizkuntza egokia hautatzen du audio gehienentzat; eskuz ere zehaztu dezakezu zehaztasun txikiagoa lortzeko.
NVIDIA Canary-k audioa 45.0x denbora errealean prozesatzen du gure GPUetan. Ordu bateko audio-fitxategi bat 1 minututan amaitzen da; fitxategi luzeagoak ilaran jarri eta e-postaz jakinarazi egiten dira amaitzen direnean.
NVIDIA Canary-k 1B parametro ditu. Modelo handiagoak zehatzagoak izaten dira, baina motelagoak; STT.ai-k NVIDIA Canary GPUan gordetzen du, beraz parametroen kopuruak ez du eraginik izango bezeroaren errendimenduan.
NVIDIA Canaryek STT.aik onartzen dituen formatu guztiak onartzen ditu: MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI eta beste batzuk. Irteera TXT, SRT, VTT, DOCX, JSON edo PDF gisa.
Bai. Hiztun-diarizazioa NVIDIA Canaryrekin batera exekutatzen da transkribapen bakoitzean — hiztun bakoitza etiketatuta dago eta gero editorean izena aldatu ahal izango duzu.
Bai. NVIDIA Canary gure kudeatutako ingurunean exekutatzen da — audioa lehenespenez prozesatu eta ezabatu egiten da, eta ez da inoiz entrenamendurako erabiltzen, aldez aurretik aukeratu gabe. Pro planek bezeroaren aldeko enkriptatzea gehitzen dute transkribapen geldituetan.
Erabili compare-stt tresna NVIDIA Canary audio beraren beste edozein onartutako modeloren aurka exekutatzeko — WER, segmentu-kopurua, bozgorailuen etiketak eta konfiantza-puntuak aldi berean ikusiko dituzu. NVIDIA Canary eta Whisper Large V3 konparaketa da gehien erabiltzen dena.
Bai. Zehaztu "nvidia-canary" modeloaren parametro gisa /v1/transcribe amaierako puntuan. Python eta Node.js SDKek NVIDIA Canary adibidea dute. API doako maila 100 minutukoa da hilean.
Bai. NVIDIA Canary CC-BY-4.0 lizentziaduna denez, zeure burua ostatatu dezakezu. STT.airen kode irekiko orrialdean proiektuaren errepositorioa eta pisuak zerrendatzen dira. Produkzio-talde gehienek gure ostatatutako bertsioa erabiltzen dute GPU-ren erosketak, modeloen trukaketak eta operazioak saltatzeko.