Transcribe with NVIDIA Canary

Ngagunakeun audio & video anu aya di dieu. Kandungan anu dilindungi ku DRM henteu didukung.

Ningkatake kanggo Diperbaiki
Private transcript
Chat with transcript
Buka karo Pro →
Gunakake file ing kene utawa klik kanggo browse
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — nganti 2GB
Muat-up file karo Pro
Ningkatake kanggo Diperbaiki
Private transcript
Chat with transcript
Buka karo Pro →
Ningkatake kanggo Diperbaiki
Recording: 0:00
Wektu nyata Lilin (sekarang)
Dioptimalake Wisp (akurat)
Link umum: 24h, teks mung · Ndaftar for 7d + audio · Pro for private links

Parobihan basa kana teks. AI ngalereskeun otomatis nalika anjeun nyarios - akurasi naék ku kecap-kecap anu langkung panjang.

Uji mikrofonmu sadurunge
❤️ Love STT.ai? Beritahu kanca-kancamu!
Sampeyan wis nggunakake transkripsi gratis sampeyan

1000 taun ka pengker, 600 taun ka tukang, 100 taun ka tukang, 100 taun ka tukang, 100 taun ka tukang.

10 free min/day 600 min gratis karo ndhaptar Tanpa kartu kredit Dienkripsi
Daftar gratis →
3.5%
WER
4
Languages
45.0x
Speed
CC-BY-4.0
License

About NVIDIA Canary

Languages Supported by NVIDIA Canary

Takon-takon sing asring diajukake

STT.ai hosts NVIDIA Canary on our GPU infrastructure so you can use it without provisioning your own hardware — upload audio or video and pick NVIDIA Canary from the model picker.

Dina benchmarks standar, NVIDIA Canary ngahontal kira-kira 3.5% Word Error Rate. Akurasi dunya nyata gumantung kana kualitas audio, accent, jeung basa; pikeun rekaman noisy atawa accented, ngarepkeun sababaraha poin persentase luhur WER.

NVIDIA Canary dijalankeun dina tingkat bébas STT.ai - unggal pengunjung kéngingkeun menit / bulan 600 tanpa biaya. Rencana anu dibayar nambihan wates per file anu langkung lami, transkripsi pribadi, sareng prioritas.

NVIDIA Canary dikaluarkeun di handapeun CC-BY-4.0, lisénsi sumber terbuka anu permisif. Anjeun tiasa ngahost NVIDIA Canary dina perkakas anjeun atanapi nganggo vérsi anu dihost urang - kaduana tiasa dianggo sacara komersial.

NVIDIA Canary ngadukung 4 basa. Auto-deteksi milih basa anu bener pikeun kabéh audio; anjeun ogé bisa nyatet éta sacara manual pikeun ngaronjatkeun akurasi.

NVIDIA Canary ngaproses audio dina kira-kira 45.0x real-time dina GPU urang. A file audio 1 jam réngsé dina handapeun 1 menit; file leuwih panjang diulit jeung ngalaporkeun ku surél nalika réngsé.

NVIDIA Canary mibanda parameter 1B. Model anu leuwih gedé leuwih akurat tapi leuwih lambat; STT.ai mibanda NVIDIA Canary dina GPU supados jumlah parameter teu mangaruhan kinerja klien.

NVIDIA Canary nampa saben format STT.ai dukungan - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, lan liya-liyane. Output minangka TXT, SRT, VTT, DOCX, JSON, utawa PDF.

Ya. Diarization speaker jalan bareng jeung NVIDIA Canary pikeun unggal transkripsi — unggal speaker dilabelkeun sarta anjeun bisa ngaganti ngaranna dina penyunting saterusna.

Ya. NVIDIA Canary dijalankeun dina lingkungan anu diurus urang — audio diolah sareng dihapus sacara piawai sareng henteu pernah dianggo pikeun latihan tanpa opt-in eksplisit. Rencana Pro nambahan enkripsi sisi klien pikeun transkripsi nalika istirahat.

Gunakeun alat compare-stt pikeun ngajalankeun NVIDIA Canary ngalawan model séjén anu didukung dina audio anu sami — anjeun bakal ningali WER, jumlah segmen, label panyatur, sarta skor confidence dibarengan-dibarengan. Perbandingan NVIDIA Canary vs Whisper Large V3 nyaéta anu paling umum dijalankeun.

Ya. Nyatakeun "nvidia-canary" minangka parameter model dina titik akhir /v1/transcribe. Python sareng Node.js SDK kalebet conto NVIDIA Canary. Tingkat API gratis kalebet 100 menit / bulan.

Ya. Kusabab NVIDIA Canary dilisensikeun ku CC-BY-4.0, anjeun tiasa ngahost éta nyalira. Halaman sumber terbuka STT.ai nyarankeun repo sareng beurat proyek. Kabéh tim produksi nganggo vérsi anu dihost pikeun ngaleupaskeun GPU procurement, swaps model, sareng ops.