Informar de Bug / Pedido de Feature

Transcrição com NVIDIA Canary

Name: NVIDIA Canary
Author: NVIDIA

Funciona com áudio e vídeo disponível publicamente. O conteúdo protegido por DRM não é suportado.

Atualização para Melhorado

Transcrição privada

Conversa com transcrição

Desbloquear com Pro →

Deixe aqui o arquivo ou clique para navegar

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — até 2GB

Lote de upload múltiplos arquivos com Pro

Atualização para Melhorado

Transcrição privada

Conversa com transcrição

Desbloquear com Pro →

Atualização para Melhorado

A fala em tempo real ao texto. A IA auto-correge ao mesmo tempo que você fala — a precisão melhora com a fala mais longa.

Teste o seu microfone primeiro

10 min/dia livre 600 min livre com inscrição Não há cartão de crédito Cifrado

Inscrever-se gratuitamente →

3.5%

WER

Línguas

45.0x

Velocidade

CC-BY-4.0

Licença

Sobre NVIDIA Canary

NVIDIA Canary é um modelo de parâmetro 1B que excele na transcrição em inglês, alemão, francês e espanhol. Construído no framework NeMo, usa um codificador FastConformer com um decodificador transformador e suporta a detecção automática da linguagem e tradução.

Línguas Suportadas por NVIDIA Canary

Inglês

Espanhol

Francês

Alemão

Informações do Modelo

FornecedorNVIDIA
Arquitetura-
LicençaCC-BY-4.0
ActualizadoMar 2026

Modelos Relacionados

3.2% WER

4.2% WER

5.1% WER

7.8% WER

3.0% WER

Perguntas frequentes

NVIDIA Canary é um modelo de fala a texto por NVIDIA. STT.ai hospeda NVIDIA Canary em nossa infraestrutura GPU para que você possa usá-lo sem providenciar seu próprio hardware — carregar áudio ou vídeo e escolher NVIDIA Canary do seletor de modelos.

Nas referências padrão, NVIDIA Canary atinge cerca de 8801% da taxa de erro do Word. A precisão do mundo real depende da qualidade, acento e linguagem do áudio; para gravações ruidosas ou acentuadas, esperam alguns pontos percentuais mais altos WER.

NVIDIA Canary corre na nível livre de STT.ai — cada visitante recebe 600 minutos para começar sem custo. Planos pagos adicionam mais limites por arquivo, transcrições privadas e filas de espera prioritárias.

NVIDIA Canary é lançado sob CC-BY-4.0, uma licença permissiva de código aberto. Você pode auto-hoste NVIDIA Canary em seu próprio hardware ou usar a nossa versão hospedada — ambos são comercialmente utilizáveis.

NVIDIA Canary suporta 4 idiomas. Auto-detecção escolhe a linguagem certa para a maioria do áudio; você também pode especificar manualmente para um pequeno elevador de precisão.

NVIDIA Canary processa áudio a cerca de 45.0x em tempo real em nosso GPUs. Um arquivo de áudio de 1 hora termina em menos de 1 minutos; arquivos mais longos cola e notifica por e-mail quando feito.

NVIDIA Canary tem 1B parâmetros. Os modelos mais grandes tendem a ser mais precisos mas mais lentos; STT.ai hosts NVIDIA Canary na GPU para que a contagem de parâmetros não afecte o seu desempenho do lado do cliente.

NVIDIA Canary aceita cada formato STT.ai suportes — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI e outros. Saída como TXT, SRT, VTT, DOCX, JSON ou PDF.

Sim. Diarização do orador corre ao lado de NVIDIA Canary para cada transcrição — cada orador é rotulado e você pode renomeá-los no editor depois.

Sim. NVIDIA Canary funciona no nosso ambiente gerenciado — áudio é processado e excluído por padrão e nunca usado para treinamento sem opt-in explícito. Pro planos adicionar criptografia do lado do cliente para transcrições no repouso.

Use a ferramenta compar-stt para executar NVIDIA Canary contra qualquer outro modelo suportado no mesmo áudio — você verá WER, contagem de segmentos, rótulos de alto-falante e pontuação de confiança lado a lado. A comparação NVIDIA Canary vs Whisper Large V3 é a mais comumente executada.

Sim. Especifique "nvidia-canary" como o parâmetro do modelo no ponto final /v1/transcribe. Python e Node.js SDKs incluem NVIDIA Canary exemplos. O nível de API gratuito inclui 100 minutos/mes.

Sim. Como NVIDIA Canary é CC-BY-4.0-licenciado, você pode hospedá-lo. STT.ai página de código aberto lista o projeto repo e pesos. A maioria das equipes de produção usa a nossa versão hospedada para saltar compras GPU, swaps de modelos e ops.

Transcrição com NVIDIA Canary

Sobre NVIDIA Canary

Línguas Suportadas por NVIDIA Canary

Informações do Modelo

Modelos Relacionados

Perguntas frequentes

O que é NVIDIA Canary?

Quão precisas são NVIDIA Canary?

NVIDIA Canary é livre de usar?

Que licença usa NVIDIA Canary?

Quantas línguas apoiam NVIDIA Canary?

Quão rápido é NVIDIA Canary?

Quão grande é o modelo NVIDIA Canary?

Que formatos de áudio podem transcrever NVIDIA Canary?

NVIDIA Canary detecta múltiplos alto-falantes?

Os meus dados são privados quando usam NVIDIA Canary?

Como se compara NVIDIA Canary com outros modelos STT?

Posso usar NVIDIA Canary através da API?

Posso executar NVIDIA Canary no meu próprio servidor?