ile Yazıya Dök NVIDIA Parakeet
3.0%
WER
1
Languages
55.0x
Speed
CC-BY-4.0
License
Hakkında NVIDIA Parakeet
NVIDIA Parakeet TDT 1.1B is a state-of-the-art English ASR model using FastConformer architecture with Token-and-Duration Transducer (TDT). It achieves near-human accuracy on standard English benchmarks and is highly optimized for NVIDIA GPUs.
Desteklenen diller NVIDIA Parakeet
Model Info
- ProviderNVIDIA
- Architecture-
- LicenseCC-BY-4.0
- UpdatedMar 2026
Sıkça Sorulan Sorular
NVIDIA Parakeet, NVIDIA tarafından geliştirilen bir konuşma-metin modelidir. STT.ai, NVIDIA Parakeet'e GPU altyapımızda ev sahipliği yapmaktadır, böylece kendi donanımınızı sağlamadan kullanabilirsiniz - ses veya video yükleyin ve model seçicisinden NVIDIA Parakeet'i seçin.
Standart referanslarda, NVIDIA Parakeet yaklaşık %3.0 kelime hata oranına ulaşmıştır.Gerçek dünya doğruluğu ses kalitesine, aksan ve dile bağlıdır; gürültülü veya aksanlı kayıtlar için, birkaç yüzde puan daha yüksek WER bekleyin.
NVIDIA Parakeet STT.ai'in ücretsiz seviyesinde çalışır - her ziyaretçi ücretsiz olarak ayda 600 dakika alır.Ödemeli planlar dosya başına daha uzun sınırlar, özel transkripsiyonlar ve öncelikli kuyruklar ekler.
NVIDIA Parakeet, CC-BY-4.0, bir açık kaynak lisansı altında yayınlanmıştır. NVIDIA Parakeet'i kendi donanımınızda kendi kendinize konumlandırabilir veya bizim konumlandırılmış sürümümüzü kullanabilirsiniz - her ikisi de ticari olarak kullanılabilir.
NVIDIA Parakeet 1 dillerini destekler. Otomatik tespit çoğu ses için doğru dili seçer; küçük bir doğruluk artırımı için el ile de belirtebilirsiniz.
NVIDIA Parakeet, GPU'larımızda yaklaşık 55.0x gerçek zamanlı ses işleme hızına sahiptir. 1 saatlik bir ses dosyası 1 dakikanın altında tamamlanır; daha uzun dosyalar kuyruğa alınır ve bittiğinde e-posta ile bildirim yapılır.
NVIDIA Parakeet'in 1.1B parametresi vardır. Daha büyük modellerin daha doğru ama daha yavaş olmasına eğilim vardır; STT.ai GPU'da NVIDIA Parakeet'e ev sahipliği yapar bu yüzden parametre sayısı istemci taraf performansınızı etkilemez.
NVIDIA Parakeet, STT.ai'in desteklediği her biçimi kabul eder - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI ve diğerleri. Çıkış TXT, SRT, VTT, DOCX, JSON veya PDF olarak.
Evet, her bir transkrip için NVIDIA Parakeet'in yanında konuşanların diarizasyonu çalışıyor. Her bir konuşan etiketleniyor ve sonradan editöründe isimlerini değiştirebilirsiniz.
Evet. NVIDIA Parakeet bizim yönetilen ortamımızda çalışıyor - ses işleme ve varsayılan olarak silinir ve açıkça opt-in olmadan eğitim için asla kullanılmaz. Pro planları, bekleyen transkripler için istemci tarafı şifreleme ekler.
Aynı ses üzerinde NVIDIA Parakeet'i diğer desteklenen modellerle karşılaştırmak için compare-stt aracı kullanın - WER, segment sayısını, hoparlör etiketlerini ve güven puanlarını yan yana göreceksiniz. NVIDIA Parakeet vs Whisper Large V3 karşılaştırması en sık yapılandır.
Evet. /v1/transcribe son noktasında model parametresi olarak "nvidia-parakeet"yi belirtin. Python ve Node.js SDK'ları NVIDIA Parakeet örneklerini içerir. Ücretsiz API katmanı ayda 100 dakika içerir.
Evet. NVIDIA Parakeet CC-BY-4.0 lisanslı olduğu için kendine ev sahipliği yapabilirsin. STT.ai'in açık kaynak sayfası proje deposunu ve ağırlıklarını listeler. Çoğu üretim ekibi GPU satın alımı, model değişimi ve operasyonları atlamak için ev sahipliği yaptığımız sürümü kullanır.