Transcribe with NVIDIA Canary
3.5%
WER
4
Languages
45.0x
Speed
CC-BY-4.0
License
About NVIDIA Canary
Model Info
- ProviderNVIDIA
- Architecture-
- LicenseCC-BY-4.0
- UpdatedMar 2026
Často kladené otázky
NVIDIA Canary je model prevodu reči na text od spoločnosti NVIDIA. STT.ai hosťuje NVIDIA Canary na našej infraštruktúre GPU, takže ho môžete používať bez zriaďovania vlastného hardvéru. Nahrajte zvuk alebo video a vyberte NVIDIA Canary z výberu modelu.
V štandardných testoch dosahuje NVIDIA Canary okolo 3.5% Word Error Rate.Reálna presnosť závisí od kvality zvuku, prízvuku a jazyka; pre hlučné alebo akcentované nahrávky očakávajte o niekoľko percentuálnych bodov vyššiu WER.
NVIDIA Canary beží na bezplatnej úrovni STT.ai - každý návštevník dostane 600 minút / mesiac bezplatne.Platené plány pridávajú dlhšie limity na súbor, súkromné prepisy a prioritné rady.
NVIDIA Canary je vydaný pod CC-BY-4.0, povolenou open-source licenciou.NVIDIA Canary môžete hosťovať na svojom vlastnom hardvéri alebo použiť našu hosťovanú verziu — obe sú komerčne použiteľné.
NVIDIA Canary podporuje 4 jazykov.Automatická detekcia vyberie správny jazyk pre väčšinu zvuku; môžete ho tiež zadať manuálne pre malý nárast presnosti.
NVIDIA Canary spracováva zvuk približne 45.0x v reálnom čase na našich grafických procesoroch. 1-hodinový zvukový súbor sa dokončí za menej ako 1 minút. Dlhšie súbory sa ukladajú do frontu a po dokončení sa upozornia e-mailom.
Väčšie modely majú tendenciu byť presnejšie, ale pomalšie; STT.ai hostí NVIDIA Canary na GPU, takže počet parametrov neovplyvňuje výkon na strane klienta.
NVIDIA Canary prijíma všetky formáty, ktoré podporuje STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI a ďalšie.Výstup ako TXT, SRT, VTT, DOCX, JSON alebo PDF.
Diarizácia hovoriacich beží spolu s NVIDIA Canary pre každý prepis — každý hovoriaci je označený a môžete ho neskôr premenovať v editore.
Áno, NVIDIA Canary je spustené v našom spravovanom prostredí – zvuk sa predvolene spracováva a odstraňuje a nikdy sa nepoužíva na školenie bez výslovného súhlasu. Plány Pro pridávajú šifrovanie na strane klienta pre prepisy v pokoji.
Použite nástroj compare-stt na porovnanie NVIDIA Canary s akýmkoľvek iným podporovaným modelom na rovnakom zvuku. Uvidíte WER, počet segmentov, popisky reproduktorov a skóre spoľahlivosti vedľa seba. Porovnanie NVIDIA Canary vs Whisper Large V3 je najčastejšie používané.
Áno. Ako parameter modelu v koncovom bode /v1/transcribe zadajte hodnotu nvidia-canary. Súpravy SDK pre jazyk Python a jazyk Node.js obsahujú príklady pre hodnotu NVIDIA Canary.
Áno, pretože NVIDIA Canary je licencovaný na CC-BY-4.0, môžete ho hosťovať sami.Stránka s otvoreným zdrojovým kódom STT.ai uvádza úložisko projektu a váhy.Väčšina produkčných tímov používa našu hosťovanú verziu na preskočenie obstarávania GPU, výmen modelov a operácií.