Transcrever com NVIDIA Parakeet

Funciona com áudio e vídeo disponível publicamente. O conteúdo protegido por DRM não é suportado.

Atualização para Melhorado
Private transcript
Conversa com transcrição
Desbloquear com Pro →
Deixe aqui o arquivo ou clique para navegar
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — até 2GB
Atualização para Melhorado
Private transcript
Conversa com transcrição
Desbloquear com Pro →
Atualização para Melhorado
Gravação: 0:00
Em tempo real Vosk (instante)
Melhorado Whisper (exacto)
Ligações públicas: 24h, texto apenas · Inscrever-se para 7d + áudio · Pro para as ligações privadas

A fala em tempo real ao texto. A IA auto-correge ao mesmo tempo que você fala — a precisão melhora com a fala mais longa.

Teste o seu microfone primeiro
❤️ Diz aos teus amigos!
Usaste as transcrições livres.

Inscreva-se gratuitamente para obter 600 minutos/mes, ou atualização para transcrições ilimitadas.

10 min/dia livre 600 min livre com inscrição Não há cartão de crédito Cifrado
Inscrever-se gratuitamente →
3.0%
WER
1
Languages
55.0x
Speed
CC-BY-4.0
License

Sobre NVIDIA Parakeet

NVIDIA Parakeet TDT 1.1B is a state-of-the-art English ASR model using FastConformer architecture with Token-and-Duration Transducer (TDT). It achieves near-human accuracy on standard English benchmarks and is highly optimized for NVIDIA GPUs.

Idiomas suportados por NVIDIA Parakeet

Perguntas frequentes

NVIDIA Parakeet é um modelo de fala a texto por NVIDIA. STT.ai hospeda NVIDIA Parakeet em nossa infraestrutura GPU para que você possa usá-lo sem providenciar seu próprio hardware — carregar áudio ou vídeo e escolher NVIDIA Parakeet do seletor de modelos.

Nas referências padrão, NVIDIA Parakeet atinge cerca de 8801% da taxa de erro do Word. A precisão do mundo real depende da qualidade, acento e linguagem do áudio; para gravações ruidosas ou acentuadas, esperam alguns pontos percentuais mais altos WER.

NVIDIA Parakeet corre no nível livre de STT.ai — cada visitante recebe 600 minutos/mes sem custo. Planos pagos adicionam mais limites por arquivo, transcrições privadas e fila de espera prioritária.

NVIDIA Parakeet é lançado sob CC-BY-4.0, uma licença permissiva de código aberto. Você pode auto-hoste NVIDIA Parakeet em seu próprio hardware ou usar a nossa versão hospedada — ambos são comercialmente utilizáveis.

NVIDIA Parakeet suporta 1 idiomas. Auto-detecção escolhe a linguagem certa para a maioria do áudio; você também pode especificar manualmente para um pequeno elevador de precisão.

NVIDIA Parakeet processa áudio a cerca de 55.0x em tempo real em nosso GPUs. Um arquivo de áudio de 1 hora termina em menos de 1 minutos; arquivos mais longos cola e notifica por e-mail quando feito.

NVIDIA Parakeet tem 1.1B parâmetros. Os modelos mais grandes tendem a ser mais precisos mas mais lentos; STT.ai hosts NVIDIA Parakeet na GPU para que a contagem de parâmetros não afecte o seu desempenho do lado do cliente.

NVIDIA Parakeet aceita cada formato STT.ai suportes — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI e outros. Saída como TXT, SRT, VTT, DOCX, JSON ou PDF.

Sim. Diarização do orador corre ao lado de NVIDIA Parakeet para cada transcrição — cada orador é rotulado e você pode renomeá-los no editor depois.

Sim. NVIDIA Parakeet funciona no nosso ambiente gerenciado — áudio é processado e excluído por padrão e nunca usado para treinamento sem opt-in explícito. Pro planos adicionar criptografia do lado do cliente para transcrições no repouso.

Use a ferramenta compar-stt para executar NVIDIA Parakeet contra qualquer outro modelo suportado no mesmo áudio — você verá WER, contagem de segmentos, rótulos de alto-falante e pontuação de confiança lado a lado. A comparação NVIDIA Parakeet vs Whisper Large V3 é a mais comumente executada.

Sim. Especifique "nvidia-parakeet" como o parâmetro do modelo no ponto final /v1/transcribe. Python e Node.js SDKs incluem NVIDIA Parakeet exemplos. O nível de API gratuito inclui 100 minutos/mes.

Sim. Como NVIDIA Parakeet é CC-BY-4.0-licenciado, você pode hospedá-lo. STT.ai página de código aberto lista o projeto repo e pesos. A maioria das equipes de produção usa a nossa versão hospedada para saltar compras GPU, swaps de modelos e ops.