Transcribe with NVIDIA Canary
3.5%
WER
4
Languages
45.0x
Speed
CC-BY-4.0
License
About NVIDIA Canary
Model Info
- ProviderNVIDIA
- Architecture-
- LicenseCC-BY-4.0
- UpdatedMar 2026
Ofta settir spurningar
NVIDIA Canary er ein tal-til-tekst-modell frá NVIDIA. STT.ai er hýsa fyri NVIDIA Canary á okkara GPU-infrakervi, so tú kanst brúka tað uttan at gera títt egna hardware tilfar - senda inn ljóð ella video og vel NVIDIA Canary frá model-veljaranum.
NVIDIA Canary hevur eina orðfeilstíð uppá umleið 3.5% í standard próvtøkum. Real-world accuracy depends on audio quality, accent, and language; for noisy or accented recordings, expect a few percentage points higher WER.
NVIDIA Canary koyrir á STT.ai1's free tier - hvør vitjandi fær 600 minuttir / mánaða uttan kostnað. gjaldandi ætlanirnar leggja longri per-file markið, private transcripts, og priority queuing.
NVIDIA Canary er útgivið undir CC-BY-4.0, einari permissivari opnari upprunaloyvisskipan. Tú kanst sjálvur vera vertur fyri NVIDIA Canary á tínum egna maskinvara ella brúka okkara vertur útgávu — báðar eru kommersielt nýtiligar.
NVIDIA Canary stuðlar 4 málum. Auto-discover velur rætta málið fyri flestu ljóðini. Tú kanst eisini velja tað manuelt fyri at fáa eina lítla øgiligari nákvæmni.
NVIDIA Canary processes audio at about 45.0x real-time on our GPUs. A 1-hour audio file finishes in under 1 minutes; longer files queue and notify by email when done.
NVIDIA Canary hevur 1B parametrar. Størri modeller hava til at vera meira nákvæmar, men hægri; STT.ai hevur NVIDIA Canary á GPU, so parameter-talið hevur ikki ávirkan á klient-síðuna.
NVIDIA Canary tekur ímóti øllum sniðum, sum STT.ai stuðlar — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, og onnur. Úttøka sum TXT, SRT, VTT, DOCX, JSON, ella PDF.
Ja. Speaker diarization runs alongside NVIDIA Canary for every transcription — each speaker is labelled and you can rename them in the editor afterwards.
Ja. NVIDIA Canary koyrir í okkara umsitingarliga umhvørvi — ljóð verður viðgjørt og slettað sum standard og verður ongantíð brúkt til venjing uttan útgreiniliga atkvøðugreiðslu. Pro-planir leggja til klient-side-kryptering fyri transkriptiónir í hvíld.
No use the compare-stt tool to run NVIDIA Canary against any other supported model on the same audio — you'll see WER, segment count, speaker labels, and confidence scores side-by-side. The NVIDIA Canary vs Whisper Large V3 comparison is the most commonly run.
Ja. Tilgreina "nvidia-canary" sum modelparameter á /v1/transcribe endapunktinum. Python og Node.js SDK'ir innihalda NVIDIA Canary dømi. Frítt API-stig fevnir um 100 minuttir/mánað.
Ja. Tí NVIDIA Canary er CC-BY-4.0-licensed, tú kanst self-host it. STT.ai's open-source page lists the project repo and weights. Most production teams use our hosted version to skip GPU procurement, model swaps, and ops.