Rapportera fel/funktionsförfrågan

Översätt med NVIDIA Canary

Name: NVIDIA Canary
Author: NVIDIA

Fungerar med allmänt tillgängligt ljud och video. DRM-skyddat innehåll stöds inte.

Uppgradering för förbättrad

Privat utskrift

Chatta med utskrift

Lås upp med Pro →

Släpp fil här eller klicka för att bläddra

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM – upp till 2GB

Batch ladda upp flera filer för

Uppgradering för förbättrad

Privat utskrift

Chatta med utskrift

Lås upp med Pro →

Uppgradering för förbättrad

Real-time tal till text. AI auto-korrigerar medan du talar — noggrannheten förbättras med längre tal.

Testa din mikrofon först

10 gratis min/dag 600 min gratis med anmälan Inget kreditkort Krypterad

Registrera dig gratis →

3.5%

WER

Språk

45.0x

Varvtal

CC-BY-4.0

Licens

Om jag inte kan NVIDIA Canary

NVIDIA Canary är en 1B-parametermodell som utmärker sig på engelska, tyska, franska och spanska transkription. Den bygger på NeMo ramverket och använder en FastConformer kodare med en transformator avkodare och stöder automatisk språkdetektering och översättning.

Språk som stöds av NVIDIA Canary

Engelska

Spanska

Franska

Tyska

Förlaga till information

LeverantörNVIDIA
Arkitektur-
LicensCC-BY-4.0
UppdateradMar 2026

Relaterade modeller

3.2% WER

4.2% WER

5.1% WER

7.8% WER

3.0% WER

Vanliga frågor

NVIDIA Canary är en tal-till-text-modell med NVIDIA. STT.ai värd NVIDIA Canary på vår GPU-infrastruktur så att du kan använda den utan att tillhandahålla din egen hårdvara – ladda upp ljud eller video och plocka NVIDIA Canary från modellen plockare.

På standard riktmärken, NVIDIA Canary uppnår cirka 8801% Word Felfrekvens. Real-world noggrannhet beror på ljudkvalitet, accent och språk; för bullriga eller accentiva inspelningar, förvänta sig några procentenheter högre WER.

NVIDIA Canary körs på STT.ai fria nivåer – varje besökare får 600 minuter att starta utan kostnad. Betalda planer lägga längre per fil gränser, privata utskrifter, och prioritet köa.

NVIDIA Canary släpps under CC-BY-4.0, en tillåtande öppen källkod licens. Du kan själv värd NVIDIA Canary på din egen hårdvara eller använda vår värd version – båda är kommersiellt användbara.

NVIDIA Canary stöder 4 språk. Automatisk upptäckt väljer rätt språk för de flesta ljud; du kan också ange det manuellt för en liten noggrannhet lyft.

NVIDIA Canary behandlar ljud på ca 45.0x realtid på våra GPUs. En 1-timmars ljudfil slutar på under 1 minuter; längre filer köa och meddela via e-post när det är gjort.

NVIDIA Canary har 1B parametrar. Större modeller tenderar att vara mer exakta men långsammare; STT.ai värd NVIDIA Canary på GPU så parametern räknas inte påverkar din klient-sidan prestanda.

NVIDIA Canary accepterar varje format STT.ai stöder — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, med flera. Utmatning som TXT, SRT, VTT, DOCX, JSON, eller PDF.

Ja. Högtalardiarization körs vid sidan av NVIDIA Canary för varje transkription — varje talare är märkt och du kan byta namn på dem i redaktören efteråt.

Ja. NVIDIA Canary körs i vår hanterade miljö — ljud behandlas och tas bort som standard och aldrig används för utbildning utan uttrycklig opt-in. Pro planer lägga klient-side kryptering för utskrifter i vila.

Använd jämförelse-stt verktyg för att köra NVIDIA Canary mot någon annan stöds modell på samma ljud - du kommer att se WER, segment räkna, högtalare etiketter och förtroende poäng sida vid sida. NVIDIA Canary vs Whisper Large V3 jämförelse är den vanligaste köras.

Ja. Ange "nvidia-canary" som modellparameter för /v1/transkriptiv endpoint. Python och Node.js SDKs inkluderar NVIDIA Canary exempel. Gratis API-nivå inkluderar 100 minuter/månad.

Ja. Eftersom NVIDIA Canary är CC-BY-4.0-licensierad, kan du själv värd den. STT.ai öppen källkod sida listar projektet repo och vikter. De flesta produktionsteam använder vår värd version för att hoppa över GPU upphandling, modellswappar, och ops.

Översätt med NVIDIA Canary

Om jag inte kan NVIDIA Canary

Språk som stöds av NVIDIA Canary

Förlaga till information

Relaterade modeller

Vanliga frågor

Vad är NVIDIA Canary?

Hur exakt är NVIDIA Canary?

Är NVIDIA Canary gratis att använda?

Vilken licens använder NVIDIA Canary?

Hur många språk stöder NVIDIA Canary?

Hur snabbt är NVIDIA Canary?

Hur stor är NVIDIA Canary-modellen?

Vilka ljudformat kan NVIDIA Canary transkribera?

Känner NVIDIA Canary av flera högtalare?

Är mina data privata när du använder NVIDIA Canary?

Hur jämför NVIDIA Canary med andra STT-modeller?

Kan jag använda NVIDIA Canary via API:et?

Kan jag köra NVIDIA Canary på min egen server?