Transcribe with NVIDIA Canary

Werkt met publiek beschikbare audio & video. DRM-beschermde inhoud wordt niet ondersteund.

Upgrade voor verbeterd
Private transcript
Chat met transcript
Ontgrendelen met Pro →
Bestand hier neerzetten of klik om te bladeren
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM tot 2GB
Upgrade voor verbeterd
Private transcript
Chat met transcript
Ontgrendelen met Pro →
Upgrade voor verbeterd
Opname: 0:00
Realtime Vosk (instant)
Verbeterd Fluisteren (nauwkeurig)
Publieke links: 24 uur, alleen tekst · Aanmelden voor 7d + audio · Pro voor privé-links

Real-time spraak op tekst. AI auto-correcties als u spreekt.. de nauwkeurigheid verbetert met langere spraak.

Test eerst je microfoon
❤️ Hou je van STT.ai? Vertel het je vrienden!
Je hebt je gratis transcripties gebruikt.

Gratis aanmelden om 600 minuten / maand te krijgen, of upgrade voor onbeperkte transcripties.

10 vrij min/dag 600 min vrij met aanmelding Geen creditcard Versleuteld
Gratis aanmelden →
3.5%
WER
4
Languages
45.0x
Speed
CC-BY-4.0
License

About NVIDIA Canary

Languages Supported by NVIDIA Canary

Veelgestelde vragen

NVIDIA Canary is een speech-to-text model van NVIDIA. STT.ai hosts NVIDIA Canary op onze GPU-infrastructuur, zodat u het kunt gebruiken zonder het voorzien van uw eigen hardware te uploaden audio of video en kies NVIDIA Canary uit de model picker.

Op standaard benchmarks bereikt NVIDIA Canary ongeveer 3.5% Word Error Rate. Real-world nauwkeurigheid is afhankelijk van audiokwaliteit, accent en taal; voor lawaaierige of geaccentueerde opnames, verwachten een paar procentpunten hoger WER.

NVIDIA Canary draait op STT.ai's gratis tier. Elke bezoeker krijgt 600 minuten / maand zonder kosten. Betaalde plannen toevoegen van langere per-bestand grenzen, prive-transcripts, en prioriteit in de wachtrij.

NVIDIA Canary wordt vrijgegeven onder CC-BY-4.0, een permissieve open-source licentie. U kunt zelf-host NVIDIA Canary op uw eigen hardware of gebruik maken van onze gehoste versie zijn beide commercieel bruikbaar.

NVIDIA Canary ondersteunt 4 talen. Autodetectie kiest de juiste taal voor de meeste audio; u kunt het ook handmatig specificeren voor een kleine nauwkeurigheid lift.

NVIDIA Canary verwerkt audio op ongeveer 45.0x real-time op onze GPU's. Een 1-uurs audiobestand eindigt in minder dan 1 minuten; langere files wachtrij en melding per e-mail wanneer gedaan.

NVIDIA Canary heeft 1B parameters. Grotere modellen hebben de neiging om nauwkeuriger maar langzamer te zijn; STT.ai hosts NVIDIA Canary op GPU zodat de parametertelling geen invloed heeft op de prestaties van uw client-side.

NVIDIA Canary accepteert elk formaat dat STT.ai ondersteunt. MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, en anderen. Output als TXT, SRT, VTT, DOCX, JSON, of PDF.

Ja. Speaker diarization loopt naast NVIDIA Canary voor elke transcriptie • elke speaker is gelabeld en je kunt ze hernoemen in de editor achteraf.

Ja. NVIDIA Canary wordt uitgevoerd in onze beheerde omgeving audio wordt verwerkt en verwijderd standaard en nooit gebruikt voor training zonder expliciete opt-in. Pro plannen toevoegen client-side encryptie voor transcripten in rust.

Gebruik de compare-stt tool om NVIDIA Canary uit te voeren tegen elk ander ondersteund model op dezelfde audio, zie je WER, segment count, speaker labels, en vertrouwen scoort side-by-side. De NVIDIA Canary vs Whisper Large V3 vergelijking is de meest voorkomende run.

Ja. Geef "nvidia-canary" op als de modelparameter op het /v1/transcribe eindpunt. Python en Node.js SDK's bevatten NVIDIA Canary voorbeelden. Gratis API tier bevat 100 minuten/maand.

Ja. Omdat NVIDIA Canary is CC-BY-4.0-licentie, kunt u zelf-hosten. STT.ai open-source pagina bevat de project repo en gewichten. De meeste productieteams gebruiken onze gehoste versie om GPU inkoop over te slaan, model swaps, en ops.