Transcribe with NVIDIA Canary
3.5%
WER
4
Languages
45.0x
Speed
CC-BY-4.0
License
About NVIDIA Canary
Model Info
- ProviderNVIDIA
- Architecture-
- LicenseCC-BY-4.0
- UpdatedMar 2026
Takon-takon sing asring diajukake
STT.ai hosts NVIDIA Canary on our GPU infrastructure so you can use it without provisioning your own hardware — upload audio or video and pick NVIDIA Canary from the model picker.
Dina benchmarks standar, NVIDIA Canary ngahontal kira-kira 3.5% Word Error Rate. Akurasi dunya nyata gumantung kana kualitas audio, accent, jeung basa; pikeun rekaman noisy atawa accented, ngarepkeun sababaraha poin persentase luhur WER.
NVIDIA Canary dijalankeun dina tingkat bébas STT.ai - unggal pengunjung kéngingkeun menit / bulan 600 tanpa biaya. Rencana anu dibayar nambihan wates per file anu langkung lami, transkripsi pribadi, sareng prioritas.
NVIDIA Canary dikaluarkeun di handapeun CC-BY-4.0, lisénsi sumber terbuka anu permisif. Anjeun tiasa ngahost NVIDIA Canary dina perkakas anjeun atanapi nganggo vérsi anu dihost urang - kaduana tiasa dianggo sacara komersial.
NVIDIA Canary ngadukung 4 basa. Auto-deteksi milih basa anu bener pikeun kabéh audio; anjeun ogé bisa nyatet éta sacara manual pikeun ngaronjatkeun akurasi.
NVIDIA Canary ngaproses audio dina kira-kira 45.0x real-time dina GPU urang. A file audio 1 jam réngsé dina handapeun 1 menit; file leuwih panjang diulit jeung ngalaporkeun ku surél nalika réngsé.
NVIDIA Canary mibanda parameter 1B. Model anu leuwih gedé leuwih akurat tapi leuwih lambat; STT.ai mibanda NVIDIA Canary dina GPU supados jumlah parameter teu mangaruhan kinerja klien.
NVIDIA Canary nampa saben format STT.ai dukungan - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, lan liya-liyane. Output minangka TXT, SRT, VTT, DOCX, JSON, utawa PDF.
Ya. Diarization speaker jalan bareng jeung NVIDIA Canary pikeun unggal transkripsi — unggal speaker dilabelkeun sarta anjeun bisa ngaganti ngaranna dina penyunting saterusna.
Ya. NVIDIA Canary dijalankeun dina lingkungan anu diurus urang — audio diolah sareng dihapus sacara piawai sareng henteu pernah dianggo pikeun latihan tanpa opt-in eksplisit. Rencana Pro nambahan enkripsi sisi klien pikeun transkripsi nalika istirahat.
Gunakeun alat compare-stt pikeun ngajalankeun NVIDIA Canary ngalawan model séjén anu didukung dina audio anu sami — anjeun bakal ningali WER, jumlah segmen, label panyatur, sarta skor confidence dibarengan-dibarengan. Perbandingan NVIDIA Canary vs Whisper Large V3 nyaéta anu paling umum dijalankeun.
Ya. Nyatakeun "nvidia-canary" minangka parameter model dina titik akhir /v1/transcribe. Python sareng Node.js SDK kalebet conto NVIDIA Canary. Tingkat API gratis kalebet 100 menit / bulan.
Ya. Kusabab NVIDIA Canary dilisensikeun ku CC-BY-4.0, anjeun tiasa ngahost éta nyalira. Halaman sumber terbuka STT.ai nyarankeun repo sareng beurat proyek. Kabéh tim produksi nganggo vérsi anu dihost pikeun ngaleupaskeun GPU procurement, swaps model, sareng ops.