Transcribe with NVIDIA Parakeet
3.0%
WER
1
Languages
55.0x
Speed
CC-BY-4.0
License
About NVIDIA Parakeet
Languages Supported by NVIDIA Parakeet
Model Info
- ProviderNVIDIA
- Architecture-
- LicenseCC-BY-4.0
- UpdatedMar 2026
Soalan Lazim
NVIDIA Parakeet adalah model pertuturan-ke-teks oleh NVIDIA. STT.ai memuatkan NVIDIA Parakeet pada infrastruktur GPU kami supaya anda boleh menggunakannya tanpa menyediakan perkakasan anda sendiri — muat naik audio atau video dan pilih NVIDIA Parakeet dari pemilih model.
Pada piawaian piawai, NVIDIA Parakeet mencapai kira-kira 3.0% Kadar Ralat Perkataan. Ketepatan dunia nyata bergantung pada kualiti audio, loghat, dan bahasa; untuk rakaman bising atau loghat, harapkan beberapa peratusan WER yang lebih tinggi.
NVIDIA Parakeet berjalan pada aras percuma STT.ai — setiap pengunjung mendapat 600 minit/bulan tanpa kos. Rancangan berbayar menambah had per-fail yang lebih panjang, transkripsi peribadi, dan baris gilir keutamaan.
NVIDIA Parakeet dikeluarkan di bawah lesen sumber terbuka CC-BY-4.0. Anda boleh memuat turun NVIDIA Parakeet pada perkakasan anda sendiri atau menggunakan versi kami yang dimuat turun — kedua-duanya boleh digunakan secara komersial.
NVIDIA Parakeet menyokong 1 bahasa. Auto-kesan memilih bahasa yang betul untuk kebanyakan audio; anda juga boleh nyatakannya secara manual untuk ketelusan yang lebih baik.
NVIDIA Parakeet memproses audio pada kira-kira 55.0x masa nyata pada GPU kami. Fail audio 1 jam selesai dalam kurang daripada 1 minit; fail yang lebih panjang berijil dan maklumkan melalui emel bila selesai.
NVIDIA Parakeet mempunyai parameter 1.1B. Model yang lebih besar cenderung lebih tepat tetapi lebih perlahan; STT.ai memuatkan NVIDIA Parakeet pada GPU jadi kiraan parameter tidak mempengaruhi prestasi sisi klien anda.
NVIDIA Parakeet menerima setiap format yang disokong STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, dan lain-lain. Output sebagai TXT, SRT, VTT, DOCX, JSON, atau PDF.
Ya. Diarisasi pembicara berjalan bersama NVIDIA Parakeet untuk setiap transkripsi — setiap pembicara dilabel dan anda boleh menamakan semula mereka dalam editor selepas itu.
Ya. NVIDIA Parakeet berjalan dalam persekitaran yang dikendalikan kami — audio diproses dan dipadam secara lalai dan tidak pernah digunakan untuk latihan tanpa opt-in yang jelas. Rancangan Pro menambah penyulitan sisi klien untuk transkripsi ketika rehat.
Gunakan alat compare-stt untuk jalankan NVIDIA Parakeet terhadap model yang disokong lain pada audio yang sama — anda akan lihat WER, kiraan segmen, label pengeras, dan skor keyakinan berdampingan. Perbandingan NVIDIA Parakeet vs Whisper Large V3 adalah yang paling biasa dijalankan.
Ya. Nyatakan "nvidia-parakeet" sebagai parameter model pada titik akhir /v1/transcribe. Python dan Node.js SDKs termasuk contoh NVIDIA Parakeet. Tahap API percuma termasuk 100 minit/bulan.
Ya. Kerana NVIDIA Parakeet adalah CC-BY-4.0-licensed, anda boleh self-host ia. STT.ai's open-source page lists the project repo and weights. Kebanyakan pasukan produksi menggunakan versi kami yang dihost untuk melepasi pembelian GPU, pertukaran model, dan ops.