Transcribe with NVIDIA Canary
3.5%
WER
4
Languages
45.0x
Speed
CC-BY-4.0
License
About NVIDIA Canary
Model Info
- ProviderNVIDIA
- Architecture-
- LicenseCC-BY-4.0
- UpdatedMar 2026
प्राय सोधिने प्रश्नहरू
NVIDIA Canary NVIDIA द्वारा एक भाषण-देखि-पाठ मोडेल हो। STT.ai हाम्रो GPU पूर्वाधारमा NVIDIA Canary होस्ट गर्दछ ताकि तपाईं आफ्नो हार्डवेयरको प्रावधान बिना यसलाई प्रयोग गर्न सक्नुहुन्छ - अडियो वा भिडियो अपलोड गर्नुहोस् र मोडेल चयनकर्ताबाट NVIDIA Canary चयन गर्नुहोस्।
मानक बेन्चमार्क मा, NVIDIA Canary वरिपरि 3.5% शब्द त्रुटि दर प्राप्त गर्दछ। वास्तविक-विश्व सटीकता अडियो गुणस्तर, उच्चारण, र भाषा निर्भर गर्दछ; हल्ला वा उच्चारण रेकर्ड लागि, केही प्रतिशत अंक उच्च WER अपेक्षा।
NVIDIA Canary STT.ai को नि: शुल्क तहमा चल्छ - हरेक आगन्तुकले कुनै लागतमा 600 मिनेट / महिना पाउँछ। भुक्तानी योजनाहरूले प्रति-फाइल सीमाहरू, निजी प्रतिलिपिहरू र प्राथमिकता कतार थप्दछ।
NVIDIA Canary CC-BY-4.0, एक permissive खुला स्रोत लाइसेन्स अन्तर्गत जारी गरिएको छ। तपाईं आफ्नो हार्डवेयर मा स्व-होस्ट गर्न सक्नुहुन्छ NVIDIA Canary वा हाम्रो होस्ट गरिएको संस्करण प्रयोग गर्नुहोस् - दुवै व्यावसायिक रूपमा प्रयोग गर्न सकिन्छ।
NVIDIA Canary ले 4 भाषाहरू समर्थन गर्दछ । स्वचालित पत्ता लगाउनले धेरै अडियोका लागि सही भाषा चयन गर्दछ; तपाईँले सानो सटीकता लिफ्टका लागि यसलाई म्यानुअल रूपमा पनि निर्दिष्ट गर्न सक्नुहुन्छ ।
NVIDIA Canary हाम्रो GPUs मा 45.0x वास्तविक समयमा अडियो प्रक्रिया गर्दछ। एक 1-घण्टा अडियो फाइल 1 मिनेट अन्तर्गत समाप्त हुन्छ; लामो फाइलहरू लामबद्ध र इमेल द्वारा सूचना दिनुहोस् जब यो पूरा हुन्छ।
NVIDIA Canary मा 1B परिमितिहरू छन्। ठूला नमूनाहरू अधिक सटीक तर ढिलो हुन्छन्; STT.ai ले GPU मा NVIDIA Canary होस्ट गर्दछ त्यसैले परिमिति गणनाले तपाईँको क्लाइन्ट-साइड प्रदर्शनलाई असर गर्दैन।
NVIDIA Canary हरेक ढाँचा स्वीकार गर्दछ STT.ai समर्थन - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, र अन्य. TXT, SRT, VTT, DOCX, JSON, वा PDF रूपमा निर्गत।
हो. वक्ता diarization साथै चल्छ NVIDIA Canary हरेक प्रतिलिपि लागि — प्रत्येक वक्ता लेबल छ र तपाईं पछि सम्पादक तिनीहरूलाई पुन: नाम गर्न सक्नुहुन्छ.
हो। NVIDIA Canary हाम्रो प्रबन्धित वातावरणमा चल्छ - अडियो प्रक्रिया र पूर्वनिर्धारित द्वारा मेटिएको छ र स्पष्ट विकल्प बिना प्रशिक्षणको लागि कहिल्यै प्रयोग गरिएको छैन। प्रो योजनाहरू आराममा प्रतिलिपिहरूको लागि क्लाइन्ट-साइड एन्क्रिप्शन थप्दछ।
तुलना-STT उपकरण प्रयोग गर्न NVIDIA Canary उही अडियो मा कुनै पनि अन्य समर्थित मोडेल विरुद्ध चलाउन - तपाईं WER देख्नेछन्, खण्ड गणना, वक्ता लेबल, र आत्मविश्वास स्कोर साइड-by-साइड. को NVIDIA Canary विरुद्ध Whisper ठूलो V3 तुलना सबैभन्दा सामान्यतया चलाउन छ.
हो । /v1/transcribe अन्त बिन्दुमा मोडेल परिमितिको रूपमा "nvidia-canary" निर्दिष्ट गर्नुहोस् । पाइथन र Node.js SDKs NVIDIA Canary उदाहरण समावेश गर्दछ । निःशुल्क API तहमा 100 मिनेट / महिना समावेश छ ।
हो। किनभने NVIDIA Canary CC-BY-4.0-लाइसेन्स गरिएको छ, तपाईं यसलाई स्व-होस्ट गर्न सक्नुहुन्छ। STT.ai को खुला स्रोत पृष्ठले परियोजना रिपो र वजन सूचीबद्ध गर्दछ। अधिकांश उत्पादन टोलीहरूले जीपीयू खरिद, मोडेल स्वीप र ओपीएस छोड्न हाम्रो होस्ट गरिएको संस्करण प्रयोग गर्दछ।