Transcribe with NVIDIA Canary
3.5%
WER
4
Languages
45.0x
Speed
CC-BY-4.0
License
About NVIDIA Canary
Model Info
- ProviderNVIDIA
- Architecture-
- LicenseCC-BY-4.0
- UpdatedMar 2026
Pitakon kang asring diajukake
STT.ai host NVIDIA Canary ing infrastruktur GPU kita supaya sampeyan bisa nggunakake tanpa provisioning piranti lunak dhewe - upload audio utawa video lan pilih NVIDIA Canary saka model pitcher.
Ing standar benchmarks, NVIDIA Canary ngrampungake sekitar 3.5% Word Error Rate. Real-world akurasi gumantung ing kualitas audio, accent, lan basa; kanggo noisey utawa accented rekaman, ngarepake sawetara persentase poin luwih dhuwur WER.
NVIDIA Canary dioperasikaké ing tingkat gratis STT.ai - saben pengunjung nampa 600 menit / wulan tanpa biaya. rencana dibayar nambah watesan per-file sing luwih dawa, transkripsi pribadi, lan prioritas queueing.
NVIDIA Canary dirilis ing ngisor CC-BY-4.0, lisensi sumber terbuka sing permisif. Sampeyan bisa nginstal NVIDIA Canary ing piranti keras dhewe utawa nggunakake versi sing dihost - loro-loroné bisa digunakake kanthi komersial.
NVIDIA Canary nyokong 4 basa. Auto-deteksi milih basa kang bener kanggo akèh audio; sampeyan uga bisa nyetel kanthi manual kanggo nambah akurasi.
NVIDIA Canary ngproses audio ing kira-kira 45.0x real-time ing GPU kita. Fail audio 1 jam rampung ing ngisor 1 menit; file luwih dawa ing gulungan lan dilaporake liwat email nalika rampung.
NVIDIA Canary duwé parameter 1B. Model kang luwih gedhé luwih akurat nanging luwih lambat; STT.ai duwé host NVIDIA Canary ing GPU supaya penghitungan parameter ora ngrusak kinerja klien.
NVIDIA Canary nampa saben format STT.ai nyokong - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, lan liyane. Output minangka TXT, SRT, VTT, DOCX, JSON, utawa PDF.
NVIDIA Canary diarization speakers dijalanaken kaliyan saben transkripsi - saben speaker dipunlabel lan sampeyan saged mènèhi jeneng anyar ing editor.
Ya. NVIDIA Canary dijalanaké ing lingkungan sing diurus — audio diproses lan dipasak kanthi pigura lan ora pernah digunakake kanggo latihan tanpa opt-in eksplisit. Rencana Pro nambah enkripsi klien-sisi kanggo transkripsi nalika ora aktif.
Gunakaké alat compare-stt kanggo nglakokaké NVIDIA Canary karo modél liya kang didhukung ing audio kang padha — sampeyan bakal ndeleng WER, penghitung segmen, label speaker, lan skor confidence side-by-side. Perbandingan NVIDIA Canary vs Whisper Large V3 iku sing paling umum dilakokaké.
Ya. Nyathet "nvidia-canary" minangka parameter model ing /v1/transcribe endpoint. Python lan Node.js SDKs ngemot conto NVIDIA Canary. Lapisan API gratis ngemot 100 menit/wulan.
Ya. Amargi NVIDIA Canary dipunlisensi CC-BY-4.0, sampeyan saged nghostaken piyambakipun. Lampiran sumber-bukah STT.ai nyathet repo proyèk lan bobot. Kathah tim produksi ingkang ngginakaken versi ingkang dipunhostaken kanggé nglewati GPU procurement, model swaps, lan ops.