Rapporter feil/ funksjonsforespørsel

Transkriber med NVIDIA Canary

Name: NVIDIA Canary
Author: NVIDIA

Arbeider med offentlig tilgjengelig lyd og video. DRM- beskyttet innhold er ikke støttet.

Oppgradering for forbedret

Privat utskrift

Chat med utskrift

Lås opp med Pro →

Slipp fil her eller trykk for å bla gjennom

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — opptil 2GB

Last opp flere filer (flerbildeverktøy) med Pro

Oppgradering for forbedret

Privat utskrift

Chat med utskrift

Lås opp med Pro →

Oppgradering for forbedret

Sanntidstale til tekst. AI korrigerer automatisk mens du snakker – nøyaktighet forbedres med lengre tale.

Test mikrofonen din først

10 gratis min/dag 600 min fri med registrering Intet kredittkort Kryptert

Registrer deg gratis →

3.5%

WER

Språk

45.0x

Hastighet

CC-BY-4.0

Lisens

Om NVIDIA Canary

NVIDIA Canary er en 1B- parametermodell som excelerer ved engelsk, tysk, fransk og spansk transkription. Byggt på NeMo- rammeverket bruker den en fastConformer- koder med en transformer- dekoder og støtter automatisk oppdaging og oversettelse av språk.

Språk støttet av NVIDIA Canary

Engelsk

Spansk

Fransk

Tysk

Modellinfo

LeverandørNVIDIA
Arkitektur-
LisensCC-BY-4.0
OppdatertMar 2026

Tilknyttede modeller

3.2% WER

4.2% WER

5.1% WER

7.8% WER

3.0% WER

Ofte stilte spørsmål

NVIDIA Canary er en tale-til-tekst-modell av NVIDIA. STT.ai er verter NVIDIA Canary på vår GPU-infrastruktur slik at du kan bruke den uten å skaffe til veie din egen maskinvare – last opp lyd eller video og velg NVIDIA Canary fra modellvelgeren.

Med standard standardverdier oppnår 88 000 omtrent 3.5% ordfeilrate. Nøyaktighet i den virkelige verden avhenger av lydkvalitet, aksent og språk. For opptak med støy eller aksent, forvent noen prosentpoeng høyere WER.

NVIDIA Canary kjører på STT.ais ledig nivå – hver besøkende får 600 minutter til å starte uten kostnad. Betalingsplaner legger til lengre filgrenser, private utskrifter og prioritetskøing.

NVIDIA Canary er frigitt under CC-BY-4.0, en ettergivende åpen kildekode- lisens. Du kan selv være vert NVIDIA Canary på din egen maskinvare eller bruke vår vertsversjon – begge kan brukes kommersielt.

NVIDIA Canary støtter 4 språk. Auto- deteksjon velger det riktige språket for de fleste lydene. Du kan også oppgi det manuelt for en liten presisjonsheis.

NVIDIA Canary behandler lyd ved omlag 45.0x i sanntid på våre GPU- er. En en- times lydfil er ferdig på under 1 minutter, lengre filkø og varsles med e- post når den er ferdig.

NVIDIA Canary har 1B parametre. Større modeller har en tendens til å være mer presise men langsommere. STT.ai er verter NVIDIA Canary på GPU så parametertallet påvirker ikke din ytelse på klientsiden.

NVIDIA Canary godtar alle format STT.ai støtter – MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI og andre. Utdata som TXT, SRT, VTT, DOCX, JSON eller PDF.

Ja. Høytalerdiarisering går sammen med NVIDIA Canary for hver utskrift – hver høyttaler er merket og du kan endre navn på dem i redigeringen etterpå.

Ja. NVIDIA Canary kjører i vårt styrte miljø – lyd behandles og slettes som standard og brukes aldri til trening uten eksplisitt valg. Pro planer legger til kryptering på klientsiden for utskrifter i hvile.

Bruk sammenlikningsverktøyet til å kjøre NVIDIA Canary mot alle andre modeller som støttes på samme lyd – du får se WER, segmenttelling, høyttal og tillitspoeng side om side. Sammenlikningen NVIDIA Canary mot Whisper Stor V3 er det vanligste kjøreverktøyet.

Ja. Oppgi « nvidia-canary » som modellparameter for sluttpunktet / v1/ trancribe. Python og Node. js SDK inkluderer NVIDIA Canary eksempler. Free API- nivå inkluderer 100 minutter/ måned.

Ja, fordi NVIDIA Canary er CC-BY-4.0-lisensert, kan du selv være vert for det. STT.ai-tallets åpen-kildekode side lister prosjektet repo og vekter. de fleste produksjonsteam bruker vår vertsversjon til å hoppe over GPU innkjøp, modellbytteavtaler og ops.

Transkriber med NVIDIA Canary

Om NVIDIA Canary

Språk støttet av NVIDIA Canary

Modellinfo

Tilknyttede modeller

Ofte stilte spørsmål

Hva er NVIDIA Canary?

Hvor nøyaktig er NVIDIA Canary?

Er NVIDIA Canary gratis å bruke?

Hvilket førerkort bruker NVIDIA Canary?

Hvor mange språk støtter NVIDIA Canary?

Hvor fort er NVIDIA Canary?

Hvor stor er NVIDIA Canary-modellen?

Hvilke lydformater kan NVIDIA Canary transskribere?

Finner NVIDIA Canary flere høyttalere?

Er mine data private når de bruker NVIDIA Canary?

Hvordan sammenlignes 88 000 med andre STT-modeller?

Kan jeg bruke NVIDIA Canary via API?

Kan jeg kjøre NVIDIA Canary på min egen tjener?