से ट्रांसक्राइब करें NVIDIA Canary
3.5%
WER
4
Languages
45.0x
Speed
CC-BY-4.0
License
के बारे में NVIDIA Canary
NVIDIA Canary is a 1B parameter model that excels at English, German, French, and Spanish transcription. Built on the NeMo framework, it uses a FastConformer encoder with a transformer decoder and supports automatic language detection and translation.
Model Info
- ProviderNVIDIA
- Architecture-
- LicenseCC-BY-4.0
- UpdatedMar 2026
अक्सर पूछे जाने वाले प्रश्न
NVIDIA Canary एक भाषण मॉडल है NVIDIA द्वारा. STT.ai सेना NVIDIA Canary हमारे जीपी में NVIDIA Canary पर इसलिए आप इसे अपने खुद के हार्डवेयर के बिना प्रयोग कर सकते हैं — ऑडियो अपलोड करें या वीडियो पता लगाने के लिए मॉडल बनाने से 8808080.
मानक Stars पर, ८८०% वचन दर के आसपास NVIDIA Canary प्राप्त करता है. वास्तविक विश्व सटीकता ऑडियो गुणवत्ता, उच्चारण, और भाषा पर निर्भर करता है. आवाज़ या टिप्पणीओं के लिए, कुछ प्रतिशत प्रतिशत प्रतिशत अधिक व विडेंट संकेत की उम्मीद करता है.
NVIDIA Canary runs on STT.ai's free tier — every visitor gets 600 minutes/month at no cost. Paid plans add longer per-file limits, private transcripts, and priority queueing.
NVIDIA Canary को CC-BY-4.0 के तहत रिहा किया गया है, एक गलत खुले स्रोत लाइसेंस. आप अपने स्वयं को H-host000 पर कर सकते हैं या हमारे मेजबानित संस्करण का उपयोग कर सकते हैं - दोनों व्यावसायिक रूप से प्रयोग कर रहे हैं.
NVIDIA Canary 4 भाषाओं का समर्थन करता है. स्वचालित रूप से ध्वनि के लिए सही भाषा लेता है; आप इसे दस्ती रूप से निर्दिष्ट कर सकते हैं एक छोटी सी सटीकता के लिए.
NVIDIA Canary प्रक्रियाओं के बारे में 45.0x वास्तविक समय हमारे जीपी. एक 1 घंटे की ध्वनि फ़ाइल 1 मिनट में होती है, अब फ़ाइलें कतार में और ईमेल द्वारा सूचना देता है.
NVIDIA Canary में 8800 पैरामीटर हैं. बड़ा मॉडल अधिक सही होने की पुष्टि करता है लेकिन धीमी; STT.ai सेना NVIDIA Canary GUCHU पर तो पैरामीटर नंबर अपने ग्राहक किनारे प्रदर्शन को प्रभावित नहीं करता.
NVIDIA Canary accepts every format STT.ai supports — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and others. Output as TXT, SRT, VTT, DOCX, JSON, or PDF.
वक्ता ने हर भाषण के लिए NVIDIA Canary लोगों के पास दौड़ता है — हर वक्ता पर लेबल लगाया जाता है और बाद में इन्हें संपादक में बदल सकता है ।
जी. NVIDIA Canary हमारे सफल वातावरण में चला जाता है — ऑडियो को डिफ़ॉल्ट रूप से संसाधित किया जाता है और उसे मिटाया नहीं जाता बिना विशिष्ट स्तर के प्रशिक्षण के लिए प्रयोग किया जाता है.
एक ही ऑडियो के खिलाफ किसी भी अन्य समर्थित मॉडल को चलाने के लिए NVIDIA Canary उपकरण का उपयोग करें - आप Werer, खण्ड गिनती, स्पीकरों, और अंक के विपरीत देखें। NVIDIA Canary v3 बड़ा V3 तुलना आम तौर पर चल रहा है।
हाँ. "8000" मॉडल का मूल्य के रूप में निर्दिष्ट करें /v1/टैक्स अंत बिन्दु पर. पायथन और नोड शामिल है NVIDIA Canary उदाहरण.
हाँ. क्योंकि NVIDIA Canary है CC-BY-4.0-कैम्प्ड, आप यह खुद से शुरू कर सकते हैं. STT.ai के खुले स्रोत पृष्ठ सूची परियोजना रीपोस और वजन. अधिकांश उत्पादन टीमों का उपयोग GUpon, मॉडलpon, मॉडल की मात्रा छोड़ देने के लिए किया गया संस्करण, और ops.