Rapportér fejl / funktionsanmodning

Transskribér med NVIDIA Canary

Name: NVIDIA Canary
Author: NVIDIA

Fungerer med offentligt tilgængelig lyd og video. DRM- beskyttet indhold understøttes ikke.

Opgradering til forbedret

Privat udskrift

Chat med udskrift

Lås op med Pro →

Slip fil her eller klik for at gennemse

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM ~ op til 2GB

Batch uploade flere filer med Pro

Opgradering til forbedret

Privat udskrift

Chat med udskrift

Lås op med Pro →

Opgradering til forbedret

Real-time tale til tekst. AI auto-korrigerer som du taler nøjagtighed forbedrer med længere tale.

Test din mikrofon først

10 gratis min/dag 600 min fri med tilmelding Intet kreditkort Krypteret

Tilmeld dig gratis →

3.5%

WER

Sprog

45.0x

Hastighed

CC-BY-4.0

Licens

Om NVIDIA Canary

NVIDIA Canary er en 1B parameter model, der excellerer på engelsk, tysk, fransk og spansk transskription. Bygget på NeMo rammer, det bruger en FastConformer encoder med en transformer dekoder og understøtter automatisk sprogdetektering og oversættelse.

Sprog understøttet af NVIDIA Canary

Engelsk

Spansk

Fransk

Tysk

Modelinformation

LeverandørNVIDIA
Arkitektur-
LicensCC-BY-4.0
OpdateretMar 2026

Relaterede modeller

3.2% WER

4.2% WER

5.1% WER

7.8% WER

3.0% WER

Ofte stillede spørgsmål

NVIDIA Canary er en tale-til-tekst model af NVIDIA. STT.ai værter NVIDIA Canary på vores GPU-infrastruktur, så du kan bruge det uden at give din egen hardware uploade lyd eller video og vælge NVIDIA Canary fra modelvælgeren.

På standard benchmarks, NVIDIA Canary opnår omkring 3.5% Word Error Rate. Real-verden nøjagtighed afhænger af lydkvalitet, accent og sprog; for støjende eller accent optagelser, forventer et par procentpoint højere WER.

NVIDIA Canary kører på STT.ai gratis niveau ! hver besøgende får 600 minutter til at starte uden omkostninger. Betalt planer tilføje længere per-fil grænser, private udskrifter, og prioritet kø.

NVIDIA Canary er udgivet under CC-BY-4.0, en permissiv open source licens. Du kan selvvært NVIDIA Canary på din egen hardware eller bruge vores hosted version! begge er kommercielt brugbare.

NVIDIA Canary understøtter 4 sprog. Auto-detektering vælger det rigtige sprog til de fleste lyd; du kan også angive det manuelt for en lille nøjagtighed elevator.

NVIDIA Canary behandler lyd på omkring 45.0x realtid på vores GPU'er. En 1-timers lydfil slutter på under 1 minutter; længere filer kø og underrette via e-mail, når det er gjort.

NVIDIA Canary har 1B parametre. Større modeller har tendens til at være mere præcise, men langsommere; STT.ai værter NVIDIA Canary på GPU, så parameteren tæller ikke påvirker din klient-side ydeevne.

NVIDIA Canary accepterer hvert format STT.ai understøtter ~ MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, og andre. Output som TXT, SRT, VTT, DOCX, JSON, eller PDF.

Ja. Speaker diarization kører sammen med NVIDIA Canary for hver transskription! hver højttaler er mærket, og du kan omdøbe dem i editoren bagefter.

Ja. NVIDIA Canary kører i vores administrerede miljø ~ lyd behandles og slettes som standard og aldrig bruges til træning uden eksplicit opt-in. Pro planer tilføje klient-side kryptering for udskrifter på hvile.

Brug sammenligning-stt værktøj til at køre NVIDIA Canary mod enhver anden understøttet model på den samme lyd! du vil se WER, segment tæller, højttaler etiketter, og tillid scorer side om side. NVIDIA Canary vs Whisper Stor V3 sammenligning er den mest almindelige køre.

Ja. Angiv "nvidia-canary" som modelparameter på /v1/transcribe endpoint. Python og node.js SDKs omfatter NVIDIA Canary eksempler. Gratis API-niveau inkluderer 100 minutter/måned.

Ja. Fordi NVIDIA Canary er CC-BY-4.0-licenseret, kan du selv være vært for det. STT.ai open source side viser projektet repo og vægte. De fleste produktionshold bruger vores hosted version til at springe GPU indkøb, model swaps og ops.

Transskribér med NVIDIA Canary

Om NVIDIA Canary

Sprog understøttet af NVIDIA Canary

Modelinformation

Relaterede modeller

Ofte stillede spørgsmål

Hvad er NVIDIA Canary?

Hvor nøjagtig er NVIDIA Canary?

Er NVIDIA Canary gratis at bruge?

Hvilken licens bruger NVIDIA Canary?

Hvor mange sprog understøtter NVIDIA Canary?

Hvor hurtigt er NVIDIA Canary?

Hvor stor er NVIDIA Canary-modellen?

Hvilke lydformater kan NVIDIA Canary transskribere?

Opdager NVIDIA Canary flere højttalere?

Er mine data private, når du bruger NVIDIA Canary?

Hvordan kan NVIDIA Canary sammenlignes med andre STT-modeller?

Kan jeg bruge NVIDIA Canary via API?

Kan jeg køre NVIDIA Canary på min egen server?