से ट्रांसक्राइब करें Whisper Large V3
4.2%
WER
99
Languages
8.0x
Speed
MIT
License
के बारे में Whisper Large V3
Whisper Large V3 is OpenAI's flagship open-source speech recognition model. With 1.55 billion parameters, it offers exceptional accuracy across 99 languages. It uses a transformer encoder-decoder architecture trained on 680,000 hours of multilingual audio data.
Model Info
- ProviderOpenAI
- Architecture-
- LicenseMIT
- UpdatedMar 2026
अक्सर पूछे जाने वाले प्रश्न
Whisper Large V3 एक भाषण मॉडल है OpenAI द्वारा. STT.ai सेना Whisper Large V3 हमारे जीपी में Whisper Large V3 पर इसलिए आप इसे अपने खुद के हार्डवेयर के बिना प्रयोग कर सकते हैं — ऑडियो अपलोड करें या वीडियो पता लगाने के लिए मॉडल बनाने से 8808080.
मानक Stars पर, ८८०% वचन दर के आसपास Whisper Large V3 प्राप्त करता है. वास्तविक विश्व सटीकता ऑडियो गुणवत्ता, उच्चारण, और भाषा पर निर्भर करता है. आवाज़ या टिप्पणीओं के लिए, कुछ प्रतिशत प्रतिशत प्रतिशत अधिक व विडेंट संकेत की उम्मीद करता है.
Whisper Large V3 runs on STT.ai's free tier — every visitor gets 600 minutes/month at no cost. Paid plans add longer per-file limits, private transcripts, and priority queueing.
Whisper Large V3 को MIT के तहत रिहा किया गया है, एक गलत खुले स्रोत लाइसेंस. आप अपने स्वयं को H-host000 पर कर सकते हैं या हमारे मेजबानित संस्करण का उपयोग कर सकते हैं - दोनों व्यावसायिक रूप से प्रयोग कर रहे हैं.
Whisper Large V3 99 भाषाओं का समर्थन करता है. स्वचालित रूप से ध्वनि के लिए सही भाषा लेता है; आप इसे दस्ती रूप से निर्दिष्ट कर सकते हैं एक छोटी सी सटीकता के लिए.
Whisper Large V3 प्रक्रियाओं के बारे में 8.0x वास्तविक समय हमारे जीपी. एक 1 घंटे की ध्वनि फ़ाइल 7 मिनट में होती है, अब फ़ाइलें कतार में और ईमेल द्वारा सूचना देता है.
Whisper Large V3 में 8800 पैरामीटर हैं. बड़ा मॉडल अधिक सही होने की पुष्टि करता है लेकिन धीमी; STT.ai सेना Whisper Large V3 GUCHU पर तो पैरामीटर नंबर अपने ग्राहक किनारे प्रदर्शन को प्रभावित नहीं करता.
Whisper Large V3 accepts every format STT.ai supports — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and others. Output as TXT, SRT, VTT, DOCX, JSON, or PDF.
वक्ता ने हर भाषण के लिए Whisper Large V3 लोगों के पास दौड़ता है — हर वक्ता पर लेबल लगाया जाता है और बाद में इन्हें संपादक में बदल सकता है ।
जी. Whisper Large V3 हमारे सफल वातावरण में चला जाता है — ऑडियो को डिफ़ॉल्ट रूप से संसाधित किया जाता है और उसे मिटाया नहीं जाता बिना विशिष्ट स्तर के प्रशिक्षण के लिए प्रयोग किया जाता है.
एक ही ऑडियो के खिलाफ किसी भी अन्य समर्थित मॉडल को चलाने के लिए Whisper Large V3 उपकरण का उपयोग करें - आप Werer, खण्ड गिनती, स्पीकरों, और अंक के विपरीत देखें। Whisper Large V3 v3 बड़ा V3 तुलना आम तौर पर चल रहा है।
हाँ. "8000" मॉडल का मूल्य के रूप में निर्दिष्ट करें /v1/टैक्स अंत बिन्दु पर. पायथन और नोड शामिल है Whisper Large V3 उदाहरण.
हाँ. क्योंकि Whisper Large V3 है MIT-कैम्प्ड, आप यह खुद से शुरू कर सकते हैं. STT.ai के खुले स्रोत पृष्ठ सूची परियोजना रीपोस और वजन. अधिकांश उत्पादन टीमों का उपयोग GUpon, मॉडलpon, मॉडल की मात्रा छोड़ देने के लिए किया गया संस्करण, और ops.