Transcribe with NVIDIA Parakeet
3.0%
WER
1
Languages
55.0x
Speed
CC-BY-4.0
License
About NVIDIA Parakeet
Languages Supported by NVIDIA Parakeet
Model Info
- ProviderNVIDIA
- Architecture-
- LicenseCC-BY-4.0
- UpdatedMar 2026
Întrebări frecvente
NVIDIA Parakeet este un model de vorbire la text până la NVIDIA. STT.ai găzduiește NVIDIA Parakeet pe infrastructura noastră GPU astfel încât să-l puteți utiliza fără a furniza propriul hardware – încărca audio sau video și alege NVIDIA Parakeet de la selector de model.
Pe baza standardelor de referință, NVIDIA Parakeet realizează aproximativ 3.0% Rata de eroare Word. Acuratețea lumii reale depinde de calitatea audio, accentul și limba; pentru înregistrări zgomotoase sau accentuate, se așteaptă la câteva puncte procentuale mai mari WER.
NVIDIA Parakeet se desfășoară pe nivelul gratuit STT.ai — fiecare vizitator obține 600 de minute/luna fără cost. Planurile plătite adaugă mai mult limite pe fișier, transcripții private și coada prioritară.
NVIDIA Parakeet este lansat sub CC-BY-4.0, o licență permisivă de open-source. Puteți auto-gazdă NVIDIA Parakeet pe propriul hardware sau utiliza versiunea noastră gazdă — ambele sunt utilizabile comercial.
NVIDIA Parakeet suportă 1 limbi. Auto-detection alege limba corectă pentru majoritatea audio; puteți, de asemenea, să o specificați manual pentru un mic lift de precizie.
NVIDIA Parakeet procesează audio la aproximativ 55.0x în timp real pe GPU-urile noastre. Un fișier audio de 1 oră se termină în sub 1 minute; fișiere mai lungi coada și notificare prin e-mail atunci când este gata.
NVIDIA Parakeet are parametri 1.1B. Modelele mai mari tind să fie mai precise, dar mai lent; STT.ai găzduiește NVIDIA Parakeet pe GPU astfel încât numărul de parametri nu afectează performanța client-side.
NVIDIA Parakeet acceptă fiecare format de suport STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI și alții. Produsă ca TXT, SRT, VTT, DOCX, JSON sau PDF.
Da. Diarizarea speakerului merge alături de NVIDIA Parakeet pentru fiecare transcriere — fiecare speaker este etichetat și le puteți renoma în editor după aceea.
Da. NVIDIA Parakeet rulează în mediul nostru gestionat – audio este prelucrat și șterse în mod implicit și nu este utilizat niciodată pentru antrenament fără opt-in explicit. Pro planuri adaugă criptare pe partea clientului pentru transcripții în odihnă.
Utilizați instrumentul compara-stt pentru a rula NVIDIA Parakeet împotriva oricărui alt model suportat pe același audio — veți vedea WER, număr de segmente, etichete de speaker și scoruri de încredere lado-a-side. NVIDIA Parakeet vs Whisper Large V3 comparație este cel mai frecvent rulat.
Da. Specificați "nvidia-parakeet" ca parametrul model pe punctul final /v1/transcrie. Python și Node.js SDKs includ NVIDIA Parakeet exemple. Nivelul API gratuit include 100 minute/luna.
Da. Deoarece NVIDIA Parakeet este CC-BY-4.0- licenciat, puteți să-l găzduiți. STT.ai de pagini de open-source listează proiectul repo și greutăți. Cele mai multe echipe de producție folosesc versiunea noastră găzduită pentru a trece peste GPU achiziții, swaps de model și ops.