Informar de fallo / Petición de características

Transcribe con NVIDIA Parakeet

Name: NVIDIA Parakeet
Author: NVIDIA

Funciona con audio y vídeo de acceso público. El contenido protegido por DRM no es compatible.

Actualizar para mejorar

Transcripciones privadas

Charla con transcripción

Desbloquear con Pro →

Soltar archivo aquí o haga clic para navegar

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — hasta 2 GB

Cargar varios archivos por lotes con Pro

Actualizar para mejorar

Transcripciones privadas

Charla con transcripción

Desbloquear con Pro →

Actualizar para mejorar

Discurso en tiempo real al texto. IA corrige automáticamente mientras habla — la precisión mejora con un discurso más largo.

Pon a prueba tu micrófono primero

10 min/día gratis 600 min gratis con registro Sin tarjeta de crédito Cifrado

Inscríbete gratis →

3.0%

WER

Idiomas

55.0x

Velocidad

CC-BY-4.0

Licencia

Acerca de NVIDIA Parakeet

NVIDIA Parakeet TDT 1.1B es un modelo ASR inglés de última generación que utiliza la arquitectura FastConformer con Transductor Token-and-Duration (TDT). Alcanza una precisión casi humana en los parámetros estándar de inglés y está altamente optimizado para GPUs NVIDIA.

Idiomas apoyados por NVIDIA Parakeet

Inglés

Información del modelo

ProveedorNVIDIA
Arquitectura-
LicenciaCC-BY-4.0
ActualizadoMar 2026

Modelos relacionados

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Preguntas frecuentes

NVIDIA Parakeet es un modelo de voz a texto de NVIDIA. STT.ai aloja NVIDIA Parakeet en nuestra infraestructura de GPU para que pueda usarlo sin aprovisionamiento de su propio hardware — subir audio o vídeo y elegir NVIDIA Parakeet del selector de modelos.

En puntos de referencia estándar, NVIDIA Parakeet alcanza alrededor de 3.0% tasa de error de Word. La precisión en el mundo real depende de la calidad de audio, el acento y el lenguaje; para grabaciones ruidosas o acentuadas, espere unos puntos porcentuales más alto WER.

NVIDIA Parakeet funciona en el nivel gratuito de STT.ai — cada visitante tiene 600 minutos para empezar sin costo. Los planes pagados añaden límites por archivo más largos, transcripciones privadas y cola de prioridad.

NVIDIA Parakeet es lanzado bajo CC-BY-4.0, una licencia de código abierto permisiva. Usted puede auto-anfitriona NVIDIA Parakeet en su propio hardware o utilizar nuestra versión alojada — ambos son comercialmente utilizables.

NVIDIA Parakeet admite 1 idiomas. La detección automática selecciona el idioma adecuado para la mayoría de audio; también puede especificarlo manualmente para un pequeño ascensor de precisión.

NVIDIA Parakeet procesa audio en aproximadamente 55.0x en tiempo real en nuestras GPUs. Un archivo de audio de 1 hora termina en menos de 1 minutos; los archivos más largos cola y notificar por correo electrónico cuando se hace.

NVIDIA Parakeet tiene parámetros 1.1B. Los modelos más grandes tienden a ser más precisos pero más lentos; STT.ai aloja NVIDIA Parakeet en GPU para que el recuento de parámetros no afecte el rendimiento de su cliente.

NVIDIA Parakeet acepta todos los soportes de formato STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, y otros. Salida como TXT, SRT, VTT, DOCX, JSON o PDF.

Sí. Diarización del altavoz corre junto a NVIDIA Parakeet para cada transcripción - cada altavoz está etiquetado y se puede cambiar el nombre en el editor después.

Sí. NVIDIA Parakeet se ejecuta en nuestro entorno gestionado — audio se procesa y elimina por defecto y nunca se utiliza para el entrenamiento sin opt-in explícito. Planes Pro añadir cifrado del lado del cliente para transcripciones en reposo.

Utilice la herramienta compare-stt para ejecutar NVIDIA Parakeet contra cualquier otro modelo soportado en el mismo audio: verá WER, conteo de segmentos, etiquetas de altavoz y puntuaciones de confianza lado a lado. La comparación NVIDIA Parakeet vs Whisper Large V3 es la más común.

Sí. Especifique "nvidia-parakeet" como parámetro de modelo en el endpoint /v1/transcribir. Los SDKs de Python y Node.js incluyen NVIDIA Parakeet ejemplos. El nivel de API libre incluye 100 minutos/mes.

Sí. Debido a que NVIDIA Parakeet es licenciada CC-BY-4.0, usted puede auto-anfitrionarlo. STT.ai's página de código abierto lista la repo proyecto y pesos. La mayoría de los equipos de producción utilizan nuestra versión alojada para saltarse la adquisición de GPU, modelos swaps, y ops.

Transcribe con NVIDIA Parakeet

Acerca de NVIDIA Parakeet

Idiomas apoyados por NVIDIA Parakeet

Información del modelo

Modelos relacionados

Preguntas frecuentes

¿Qué es NVIDIA Parakeet?

¿Qué tan exacto es NVIDIA Parakeet?

¿Es NVIDIA Parakeet libre de usar?

¿Qué licencia usa NVIDIA Parakeet?

¿Cuántos idiomas soportan NVIDIA Parakeet?

¿Qué tan rápido es NVIDIA Parakeet?

¿Qué tan grande es el modelo NVIDIA Parakeet?

¿Qué formatos de audio pueden transcribir NVIDIA Parakeet?

¿Detecta NVIDIA Parakeet varios altavoces?

¿Mis datos son privados al usar NVIDIA Parakeet?

¿Cómo se compara NVIDIA Parakeet con otros modelos STT?

¿Puedo utilizar NVIDIA Parakeet a través de la API?

¿Puedo ejecutar NVIDIA Parakeet en mi propio servidor?