से ट्रांसक्राइब करें NVIDIA Parakeet
3.0%
WER
1
Languages
55.0x
Speed
CC-BY-4.0
License
के बारे में NVIDIA Parakeet
NVIDIA Parakeet TDT 1.1B is a state-of-the-art English ASR model using FastConformer architecture with Token-and-Duration Transducer (TDT). It achieves near-human accuracy on standard English benchmarks and is highly optimized for NVIDIA GPUs.
द्वारा समर्थित भाषाएँ NVIDIA Parakeet
Model Info
- ProviderNVIDIA
- Architecture-
- LicenseCC-BY-4.0
- UpdatedMar 2026
अक्सर पूछे जाने वाले प्रश्न
NVIDIA Parakeet एक भाषण मॉडल है NVIDIA द्वारा. STT.ai सेना NVIDIA Parakeet हमारे जीपी में NVIDIA Parakeet पर इसलिए आप इसे अपने खुद के हार्डवेयर के बिना प्रयोग कर सकते हैं — ऑडियो अपलोड करें या वीडियो पता लगाने के लिए मॉडल बनाने से 8808080.
मानक Stars पर, ८८०% वचन दर के आसपास NVIDIA Parakeet प्राप्त करता है. वास्तविक विश्व सटीकता ऑडियो गुणवत्ता, उच्चारण, और भाषा पर निर्भर करता है. आवाज़ या टिप्पणीओं के लिए, कुछ प्रतिशत प्रतिशत प्रतिशत अधिक व विडेंट संकेत की उम्मीद करता है.
NVIDIA Parakeet runs on STT.ai's free tier — every visitor gets 600 minutes/month at no cost. Paid plans add longer per-file limits, private transcripts, and priority queueing.
NVIDIA Parakeet को CC-BY-4.0 के तहत रिहा किया गया है, एक गलत खुले स्रोत लाइसेंस. आप अपने स्वयं को H-host000 पर कर सकते हैं या हमारे मेजबानित संस्करण का उपयोग कर सकते हैं - दोनों व्यावसायिक रूप से प्रयोग कर रहे हैं.
NVIDIA Parakeet 1 भाषाओं का समर्थन करता है. स्वचालित रूप से ध्वनि के लिए सही भाषा लेता है; आप इसे दस्ती रूप से निर्दिष्ट कर सकते हैं एक छोटी सी सटीकता के लिए.
NVIDIA Parakeet प्रक्रियाओं के बारे में 55.0x वास्तविक समय हमारे जीपी. एक 1 घंटे की ध्वनि फ़ाइल 1 मिनट में होती है, अब फ़ाइलें कतार में और ईमेल द्वारा सूचना देता है.
NVIDIA Parakeet में 8800 पैरामीटर हैं. बड़ा मॉडल अधिक सही होने की पुष्टि करता है लेकिन धीमी; STT.ai सेना NVIDIA Parakeet GUCHU पर तो पैरामीटर नंबर अपने ग्राहक किनारे प्रदर्शन को प्रभावित नहीं करता.
NVIDIA Parakeet accepts every format STT.ai supports — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and others. Output as TXT, SRT, VTT, DOCX, JSON, or PDF.
वक्ता ने हर भाषण के लिए NVIDIA Parakeet लोगों के पास दौड़ता है — हर वक्ता पर लेबल लगाया जाता है और बाद में इन्हें संपादक में बदल सकता है ।
जी. NVIDIA Parakeet हमारे सफल वातावरण में चला जाता है — ऑडियो को डिफ़ॉल्ट रूप से संसाधित किया जाता है और उसे मिटाया नहीं जाता बिना विशिष्ट स्तर के प्रशिक्षण के लिए प्रयोग किया जाता है.
एक ही ऑडियो के खिलाफ किसी भी अन्य समर्थित मॉडल को चलाने के लिए NVIDIA Parakeet उपकरण का उपयोग करें - आप Werer, खण्ड गिनती, स्पीकरों, और अंक के विपरीत देखें। NVIDIA Parakeet v3 बड़ा V3 तुलना आम तौर पर चल रहा है।
हाँ. "8000" मॉडल का मूल्य के रूप में निर्दिष्ट करें /v1/टैक्स अंत बिन्दु पर. पायथन और नोड शामिल है NVIDIA Parakeet उदाहरण.
हाँ. क्योंकि NVIDIA Parakeet है CC-BY-4.0-कैम्प्ड, आप यह खुद से शुरू कर सकते हैं. STT.ai के खुले स्रोत पृष्ठ सूची परियोजना रीपोस और वजन. अधिकांश उत्पादन टीमों का उपयोग GUpon, मॉडलpon, मॉडल की मात्रा छोड़ देने के लिए किया गया संस्करण, और ops.