Transcribe with NVIDIA Canary

Nggawe karo audio lan video kang ana ing donya. Kandungan kang dilindhungi DRM ora didhukung.

Upgrade for Enhanced
Private transcript
Chat karo transcript
Ditutup karo Pro →
Gunakake file iki kanggo nyalin lan nempel
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — nganti 2GB
Upgrade for Enhanced
Private transcript
Chat karo transcript
Ditutup karo Pro →
Upgrade for Enhanced
Rekaman: 0:00
Real-time Lilin (seda)
Dioptimalake Wiwit iku (ing basa Jawa)
24 jam, 24 jam, 24 jam, 24 jam, 24 jam. · Langganan kanggo 7d + audio · Pro for private links

Real-time speech to text. AI auto-corrects nalika sampeyan ngomong - akurasi tambah karo basa sing luwih dawa.

Uji mikrofonmu pisanan
❤️ STT.ai? Nyathet kanca-kancamu!
Sampeyan wis nggunakake transkripsi gratis sampeyan

Ing taun 1996, dhèwèké gabung karo grup musik 600 Minutes, lan wiwit main ing acara-acara hiburan.

10 menit/dina 600 min gratis karo signup Ora ana kertu kredit Dienkripsi
Sign up free →
3.5%
WER
4
Languages
45.0x
Speed
CC-BY-4.0
License

About NVIDIA Canary

Languages Supported by NVIDIA Canary

Pitakon kang asring diajukake

STT.ai host NVIDIA Canary ing infrastruktur GPU kita supaya sampeyan bisa nggunakake tanpa provisioning piranti lunak dhewe - upload audio utawa video lan pilih NVIDIA Canary saka model pitcher.

Ing standar benchmarks, NVIDIA Canary ngrampungake sekitar 3.5% Word Error Rate. Real-world akurasi gumantung ing kualitas audio, accent, lan basa; kanggo noisey utawa accented rekaman, ngarepake sawetara persentase poin luwih dhuwur WER.

NVIDIA Canary dioperasikaké ing tingkat gratis STT.ai - saben pengunjung nampa 600 menit / wulan tanpa biaya. rencana dibayar nambah watesan per-file sing luwih dawa, transkripsi pribadi, lan prioritas queueing.

NVIDIA Canary dirilis ing ngisor CC-BY-4.0, lisensi sumber terbuka sing permisif. Sampeyan bisa nginstal NVIDIA Canary ing piranti keras dhewe utawa nggunakake versi sing dihost - loro-loroné bisa digunakake kanthi komersial.

NVIDIA Canary nyokong 4 basa. Auto-deteksi milih basa kang bener kanggo akèh audio; sampeyan uga bisa nyetel kanthi manual kanggo nambah akurasi.

NVIDIA Canary ngproses audio ing kira-kira 45.0x real-time ing GPU kita. Fail audio 1 jam rampung ing ngisor 1 menit; file luwih dawa ing gulungan lan dilaporake liwat email nalika rampung.

NVIDIA Canary duwé parameter 1B. Model kang luwih gedhé luwih akurat nanging luwih lambat; STT.ai duwé host NVIDIA Canary ing GPU supaya penghitungan parameter ora ngrusak kinerja klien.

NVIDIA Canary nampa saben format STT.ai nyokong - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, lan liyane. Output minangka TXT, SRT, VTT, DOCX, JSON, utawa PDF.

NVIDIA Canary diarization speakers dijalanaken kaliyan saben transkripsi - saben speaker dipunlabel lan sampeyan saged mènèhi jeneng anyar ing editor.

Ya. NVIDIA Canary dijalanaké ing lingkungan sing diurus — audio diproses lan dipasak kanthi pigura lan ora pernah digunakake kanggo latihan tanpa opt-in eksplisit. Rencana Pro nambah enkripsi klien-sisi kanggo transkripsi nalika ora aktif.

Gunakaké alat compare-stt kanggo nglakokaké NVIDIA Canary karo modél liya kang didhukung ing audio kang padha — sampeyan bakal ndeleng WER, penghitung segmen, label speaker, lan skor confidence side-by-side. Perbandingan NVIDIA Canary vs Whisper Large V3 iku sing paling umum dilakokaké.

Ya. Nyathet "nvidia-canary" minangka parameter model ing /v1/transcribe endpoint. Python lan Node.js SDKs ngemot conto NVIDIA Canary. Lapisan API gratis ngemot 100 menit/wulan.

Ya. Amargi NVIDIA Canary dipunlisensi CC-BY-4.0, sampeyan saged nghostaken piyambakipun. Lampiran sumber-bukah STT.ai nyathet repo proyèk lan bobot. Kathah tim produksi ingkang ngginakaken versi ingkang dipunhostaken kanggé nglewati GPU procurement, model swaps, lan ops.