Informar de Bug / Pedido de Feature

Transcrição com NVIDIA Parakeet

Name: NVIDIA Parakeet
Author: NVIDIA

Funciona com áudio e vídeo disponível publicamente. O conteúdo protegido por DRM não é suportado.

Atualização para Melhorado

Transcrição privada

Conversa com transcrição

Desbloquear com Pro →

Deixe aqui o arquivo ou clique para navegar

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — até 2GB

Lote de upload múltiplos arquivos com Pro

Atualização para Melhorado

Transcrição privada

Conversa com transcrição

Desbloquear com Pro →

Atualização para Melhorado

A fala em tempo real ao texto. A IA auto-correge ao mesmo tempo que você fala — a precisão melhora com a fala mais longa.

Teste o seu microfone primeiro

10 min/dia livre 600 min livre com inscrição Não há cartão de crédito Cifrado

Inscrever-se gratuitamente →

3.0%

WER

Línguas

55.0x

Velocidade

CC-BY-4.0

Licença

Sobre NVIDIA Parakeet

NVIDIA Parakeet TDT 1.1B é um modelo ASR de última geração em inglês usando a arquitetura FastConformer com Transdutor Token-and-Duration (TDT). Consegue a precisão quase humana em índices de referência padrão em inglês e é altamente otimizado para GPUs NVIDIA.

Línguas Suportadas por NVIDIA Parakeet

Inglês

Informações do Modelo

FornecedorNVIDIA
Arquitetura-
LicençaCC-BY-4.0
ActualizadoMar 2026

Modelos Relacionados

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Perguntas frequentes

NVIDIA Parakeet é um modelo de fala a texto por NVIDIA. STT.ai hospeda NVIDIA Parakeet em nossa infraestrutura GPU para que você possa usá-lo sem providenciar seu próprio hardware — carregar áudio ou vídeo e escolher NVIDIA Parakeet do seletor de modelos.

Nas referências padrão, NVIDIA Parakeet atinge cerca de 8801% da taxa de erro do Word. A precisão do mundo real depende da qualidade, acento e linguagem do áudio; para gravações ruidosas ou acentuadas, esperam alguns pontos percentuais mais altos WER.

NVIDIA Parakeet corre na nível livre de STT.ai — cada visitante recebe 600 minutos para começar sem custo. Planos pagos adicionam mais limites por arquivo, transcrições privadas e filas de espera prioritárias.

NVIDIA Parakeet é lançado sob CC-BY-4.0, uma licença permissiva de código aberto. Você pode auto-hoste NVIDIA Parakeet em seu próprio hardware ou usar a nossa versão hospedada — ambos são comercialmente utilizáveis.

NVIDIA Parakeet suporta 1 idiomas. Auto-detecção escolhe a linguagem certa para a maioria do áudio; você também pode especificar manualmente para um pequeno elevador de precisão.

NVIDIA Parakeet processa áudio a cerca de 55.0x em tempo real em nosso GPUs. Um arquivo de áudio de 1 hora termina em menos de 1 minutos; arquivos mais longos cola e notifica por e-mail quando feito.

NVIDIA Parakeet tem 1.1B parâmetros. Os modelos mais grandes tendem a ser mais precisos mas mais lentos; STT.ai hosts NVIDIA Parakeet na GPU para que a contagem de parâmetros não afecte o seu desempenho do lado do cliente.

NVIDIA Parakeet aceita cada formato STT.ai suportes — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI e outros. Saída como TXT, SRT, VTT, DOCX, JSON ou PDF.

Sim. Diarização do orador corre ao lado de NVIDIA Parakeet para cada transcrição — cada orador é rotulado e você pode renomeá-los no editor depois.

Sim. NVIDIA Parakeet funciona no nosso ambiente gerenciado — áudio é processado e excluído por padrão e nunca usado para treinamento sem opt-in explícito. Pro planos adicionar criptografia do lado do cliente para transcrições no repouso.

Use a ferramenta compar-stt para executar NVIDIA Parakeet contra qualquer outro modelo suportado no mesmo áudio — você verá WER, contagem de segmentos, rótulos de alto-falante e pontuação de confiança lado a lado. A comparação NVIDIA Parakeet vs Whisper Large V3 é a mais comumente executada.

Sim. Especifique "nvidia-parakeet" como o parâmetro do modelo no ponto final /v1/transcribe. Python e Node.js SDKs incluem NVIDIA Parakeet exemplos. O nível de API gratuito inclui 100 minutos/mes.

Sim. Como NVIDIA Parakeet é CC-BY-4.0-licenciado, você pode hospedá-lo. STT.ai página de código aberto lista o projeto repo e pesos. A maioria das equipes de produção usa a nossa versão hospedada para saltar compras GPU, swaps de modelos e ops.

Transcrição com NVIDIA Parakeet

Sobre NVIDIA Parakeet

Línguas Suportadas por NVIDIA Parakeet

Informações do Modelo

Modelos Relacionados

Perguntas frequentes

O que é NVIDIA Parakeet?

Quão precisas são NVIDIA Parakeet?

NVIDIA Parakeet é livre de usar?

Que licença usa NVIDIA Parakeet?

Quantas línguas apoiam NVIDIA Parakeet?

Quão rápido é NVIDIA Parakeet?

Quão grande é o modelo NVIDIA Parakeet?

Que formatos de áudio podem transcrever NVIDIA Parakeet?

NVIDIA Parakeet detecta múltiplos alto-falantes?

Os meus dados são privados quando usam NVIDIA Parakeet?

Como se compara NVIDIA Parakeet com outros modelos STT?

Posso usar NVIDIA Parakeet através da API?

Posso executar NVIDIA Parakeet no meu próprio servidor?