Transcribe with NVIDIA Canary
3.5%
WER
4
Languages
45.0x
Speed
CC-BY-4.0
License
About NVIDIA Canary
Model Info
- ProviderNVIDIA
- Architecture-
- LicenseCC-BY-4.0
- UpdatedMar 2026
Vanliga frågor
NVIDIA Canary är en tal-till-text-modell med NVIDIA. STT.ai värd NVIDIA Canary på vår GPU-infrastruktur så att du kan använda den utan att tillhandahålla din egen hårdvara – ladda upp ljud eller video och plocka NVIDIA Canary från modellen plockare.
På standard riktmärken, NVIDIA Canary uppnår cirka 8801% Word Felfrekvens. Real-world noggrannhet beror på ljudkvalitet, accent och språk; för bullriga eller accentiva inspelningar, förvänta sig några procentenheter högre WER.
NVIDIA Canary körs på STT.ai gratis nivå – varje besökare får 600 minuter/månad utan kostnad. Betald planer lägga längre per fil gränser, privata utskrifter, och prioritet köa.
NVIDIA Canary släpps under CC-BY-4.0, en tillåtande öppen källkod licens. Du kan själv värd NVIDIA Canary på din egen hårdvara eller använda vår värd version – båda är kommersiellt användbara.
NVIDIA Canary stöder 4 språk. Automatisk upptäckt väljer rätt språk för de flesta ljud; du kan också ange det manuellt för en liten noggrannhet lyft.
NVIDIA Canary behandlar ljud på ca 45.0x realtid på våra GPUs. En 1-timmars ljudfil slutar på under 1 minuter; längre filer köa och meddela via e-post när det är gjort.
NVIDIA Canary har 1B parametrar. Större modeller tenderar att vara mer exakta men långsammare; STT.ai värd NVIDIA Canary på GPU så parametern räknas inte påverkar din klient-sidan prestanda.
NVIDIA Canary accepterar varje format STT.ai stöder — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, med flera. Utmatning som TXT, SRT, VTT, DOCX, JSON, eller PDF.
Ja. Högtalardiarization körs vid sidan av NVIDIA Canary för varje transkription — varje talare är märkt och du kan byta namn på dem i redaktören efteråt.
Ja. NVIDIA Canary körs i vår hanterade miljö — ljud behandlas och tas bort som standard och aldrig används för utbildning utan uttrycklig opt-in. Pro planer lägga klient-side kryptering för utskrifter i vila.
Använd jämförelse-stt verktyg för att köra NVIDIA Canary mot någon annan stöds modell på samma ljud - du kommer att se WER, segment räkna, högtalare etiketter och förtroende poäng sida vid sida. NVIDIA Canary vs Whisper Large V3 jämförelse är den vanligaste köras.
Ja. Ange "nvidia-canary" som modellparameter för /v1/transkriptiv endpoint. Python och Node.js SDKs inkluderar NVIDIA Canary exempel. Gratis API-nivå inkluderar 100 minuter/månad.
Ja. Eftersom NVIDIA Canary är CC-BY-4.0-licensierad, kan du själv värd den. STT.ai öppen källkod sida listar projektet repo och vikter. De flesta produktionsteam använder vår värd version för att hoppa över GPU upphandling, modellswappar, och ops.