Transcribe with NVIDIA Parakeet
3.0%
WER
1
Languages
55.0x
Speed
CC-BY-4.0
License
About NVIDIA Parakeet
Languages Supported by NVIDIA Parakeet
Model Info
- ProviderNVIDIA
- Architecture-
- LicenseCC-BY-4.0
- UpdatedMar 2026
Preguntas frecuentes
NVIDIA Parakeet é un modelo de voz a texto de NVIDIA. STT.ai aloxa NVIDIA Parakeet na nosa infraestrutura de GPU para que poida usalo sen ter que aprovisionar o seu propio hardware: envíe son ou vídeo e escolla NVIDIA Parakeet no selector de modelos.
En probas estándar, NVIDIA Parakeet alcanza unha taxa de erro de palabra do 3.0%. A precisión real depende da calidade do son, do acento e da linguaxe; para gravacións ruidosas ou acentuadas, espere uns poucos puntos porcentuais máis altos de WER.
NVIDIA Parakeet executase no nivel gratuíto de STT.ai — cada visitante obtén 600 minutos/ mes sen custo. Os plans de pago engaden límites máis longos por ficheiro, transcricións privadas e filas de prioridade.
NVIDIA Parakeet é publicado baixo CC-BY-4.0, unha licenza permisiva de código aberto. Pode aloxar NVIDIA Parakeet no seu propio hardware ou usar a nosa versión aloxada, ambas as dúas son comercialmente utilizables.
NVIDIA Parakeet soporta 1 linguas. A detección automática escolle a lingua correcta para a maioría do son; tamén pode especificala manualmente para un pequeno aumento de precisión.
NVIDIA Parakeet procesa o son a uns 55.0x en tempo real nas nosas GPU. Un ficheiro de son de 1 hora remata en menos de 1 minutos; os ficheiros máis longos enfróntanse e avísanse por correo electrónico cando rematan.
NVIDIA Parakeet ten parámetros 1.1B. Os modelos maiores tenden a ser máis precisos pero máis lentos; STT.ai aloxa NVIDIA Parakeet na GPU polo que a contaxe de parámetros non afecta ao rendemento do lado do cliente.
NVIDIA Parakeet acepta todos os formatos soportados por STT.ai: MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI e outros. Saída como TXT, SRT, VTT, DOCX, JSON ou PDF.
Si. A diarización do falante corre xunto co NVIDIA Parakeet para cada transcrición - cada falante está etiquetado e pode mudarlle o nome no editor despois.
Si. NVIDIA Parakeet executase no noso entorno xestionado — o son é procesado e borrado por omisión e nunca é usado para adestramento sen unha opción explícita. Os plans Pro engadirán cifrado do lado do cliente para as transcricións en repouso.
Use a ferramenta compare- stt para executar o NVIDIA Parakeet contra calquera outro modelo soportado no mesmo son — verá o WER, o número de segmentos, as etiquetas dos altofalantes e as puntuacións de confianza lado a lado. A comparación NVIDIA Parakeet vs Whisper Large V3 é a máis común.
Si. Especifique « nvidia-parakeet » como parámetro do modelo no punto final / v1/ transcribe. Os SDK de Python e Node. js inclúen exemplos de NVIDIA Parakeet. O nivel de API gratuíto inclúe 100 minutos/ mes.
Si. Como NVIDIA Parakeet ten licenza CC-BY-4.0, pode aloxalo vostede mesmo. A páxina de código aberto de STT.ai lista o repositorio e os pesos do proxecto. A maioría dos equipos de produción usan a nosa versión aloxada para saltar a procura de GPU, intercambios de modelos e operacións.