Transcribe with Whisper Large V3
4.2%
WER
99
Languages
8.0x
Speed
MIT
License
About Whisper Large V3
Model Info
- ProviderOpenAI
- Architecture-
- LicenseMIT
- UpdatedMar 2026
प्राय सोधिने प्रश्नहरू
Whisper Large V3 OpenAI द्वारा एक भाषण-देखि-पाठ मोडेल हो। STT.ai हाम्रो GPU पूर्वाधारमा Whisper Large V3 होस्ट गर्दछ ताकि तपाईं आफ्नो हार्डवेयरको प्रावधान बिना यसलाई प्रयोग गर्न सक्नुहुन्छ - अडियो वा भिडियो अपलोड गर्नुहोस् र मोडेल चयनकर्ताबाट Whisper Large V3 चयन गर्नुहोस्।
मानक बेन्चमार्क मा, Whisper Large V3 वरिपरि 4.2% शब्द त्रुटि दर प्राप्त गर्दछ। वास्तविक-विश्व सटीकता अडियो गुणस्तर, उच्चारण, र भाषा निर्भर गर्दछ; हल्ला वा उच्चारण रेकर्ड लागि, केही प्रतिशत अंक उच्च WER अपेक्षा।
Whisper Large V3 STT.ai को नि: शुल्क तहमा चल्छ - हरेक आगन्तुकले कुनै लागतमा 600 मिनेट / महिना पाउँछ। भुक्तानी योजनाहरूले प्रति-फाइल सीमाहरू, निजी प्रतिलिपिहरू र प्राथमिकता कतार थप्दछ।
Whisper Large V3 MIT, एक permissive खुला स्रोत लाइसेन्स अन्तर्गत जारी गरिएको छ। तपाईं आफ्नो हार्डवेयर मा स्व-होस्ट गर्न सक्नुहुन्छ Whisper Large V3 वा हाम्रो होस्ट गरिएको संस्करण प्रयोग गर्नुहोस् - दुवै व्यावसायिक रूपमा प्रयोग गर्न सकिन्छ।
Whisper Large V3 ले 99 भाषाहरू समर्थन गर्दछ । स्वचालित पत्ता लगाउनले धेरै अडियोका लागि सही भाषा चयन गर्दछ; तपाईँले सानो सटीकता लिफ्टका लागि यसलाई म्यानुअल रूपमा पनि निर्दिष्ट गर्न सक्नुहुन्छ ।
Whisper Large V3 हाम्रो GPUs मा 8.0x वास्तविक समयमा अडियो प्रक्रिया गर्दछ। एक 1-घण्टा अडियो फाइल 7 मिनेट अन्तर्गत समाप्त हुन्छ; लामो फाइलहरू लामबद्ध र इमेल द्वारा सूचना दिनुहोस् जब यो पूरा हुन्छ।
Whisper Large V3 मा 1.55B परिमितिहरू छन्। ठूला नमूनाहरू अधिक सटीक तर ढिलो हुन्छन्; STT.ai ले GPU मा Whisper Large V3 होस्ट गर्दछ त्यसैले परिमिति गणनाले तपाईँको क्लाइन्ट-साइड प्रदर्शनलाई असर गर्दैन।
Whisper Large V3 हरेक ढाँचा स्वीकार गर्दछ STT.ai समर्थन - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, र अन्य. TXT, SRT, VTT, DOCX, JSON, वा PDF रूपमा निर्गत।
हो. वक्ता diarization साथै चल्छ Whisper Large V3 हरेक प्रतिलिपि लागि — प्रत्येक वक्ता लेबल छ र तपाईं पछि सम्पादक तिनीहरूलाई पुन: नाम गर्न सक्नुहुन्छ.
हो। Whisper Large V3 हाम्रो प्रबन्धित वातावरणमा चल्छ - अडियो प्रक्रिया र पूर्वनिर्धारित द्वारा मेटिएको छ र स्पष्ट विकल्प बिना प्रशिक्षणको लागि कहिल्यै प्रयोग गरिएको छैन। प्रो योजनाहरू आराममा प्रतिलिपिहरूको लागि क्लाइन्ट-साइड एन्क्रिप्शन थप्दछ।
तुलना-STT उपकरण प्रयोग गर्न Whisper Large V3 उही अडियो मा कुनै पनि अन्य समर्थित मोडेल विरुद्ध चलाउन - तपाईं WER देख्नेछन्, खण्ड गणना, वक्ता लेबल, र आत्मविश्वास स्कोर साइड-by-साइड. को Whisper Large V3 विरुद्ध Whisper ठूलो V3 तुलना सबैभन्दा सामान्यतया चलाउन छ.
हो । /v1/transcribe अन्त बिन्दुमा मोडेल परिमितिको रूपमा "whisper-large-v3" निर्दिष्ट गर्नुहोस् । पाइथन र Node.js SDKs Whisper Large V3 उदाहरण समावेश गर्दछ । निःशुल्क API तहमा 100 मिनेट / महिना समावेश छ ।
हो। किनभने Whisper Large V3 MIT-लाइसेन्स गरिएको छ, तपाईं यसलाई स्व-होस्ट गर्न सक्नुहुन्छ। STT.ai को खुला स्रोत पृष्ठले परियोजना रिपो र वजन सूचीबद्ध गर्दछ। अधिकांश उत्पादन टोलीहरूले जीपीयू खरिद, मोडेल स्वीप र ओपीएस छोड्न हाम्रो होस्ट गरिएको संस्करण प्रयोग गर्दछ।