से ट्रांसक्राइब करें Whisper Large V3

सार्वजनिक उपलब्ध ऑडियो व वीडियो के साथ कार्य करता है. वीएनसी सामग्री समर्थित नहीं है.

उन्नत बनाने के लिए उन्नत बनाएँ
Private transcript
चेक के साथ गपशप करें
योजना के साथ ताला खोलें →
फ़ाइल यहाँ क्लिक करें या ब्राउज़ करने के लिए क्लिक करें
एमपी3, W4A, FLAC, एमपी4, एमकेवी, एम. वी.
उन्नत बनाने के लिए उन्नत बनाएँ
Private transcript
चेक के साथ गपशप करें
योजना के साथ ताला खोलें →
उन्नत बनाने के लिए उन्नत बनाएँ
रिकार्डिंग: 0:00
रीयल- टाइम वोस्क (प्रयोग में)
एनहैंस्ड Whisper (सटीक)
सार्वजनिक लिंक: 24h, पाठ सिर्फ · ऊपर हस्ताक्षर करें 7d + ऑडियो के लिए · प्रोग्रेड निजी कड़ियों के लिए

पाठ को सही तरह से बोलने के लिए सही समय. एआई स्वचालित सुधार जैसे आप बोलते हैं - सही भाषा के साथ सुधार.

अपना माइक्रोफोन पहले टेस्ट करें
❤️ अपने दोस्तों को बताओ!
आप अपने मुफ्त विज्ञापन इस्तेमाल किया है

600 मिनट/ माह पाने के लिए मुफ्त का हस्ताक्षर, या असीमित जाँच के लिए उन्नत.

10 खाली मि. / दिन साइन अप के साथ 600 मिनट मुक्त कोई क्रेडिट कार्ड नहीं गुप्त
मुक्त साइन अप →
4.2%
WER
99
Languages
8.0x
Speed
MIT
License

के बारे में Whisper Large V3

Whisper Large V3 is OpenAI's flagship open-source speech recognition model. With 1.55 billion parameters, it offers exceptional accuracy across 99 languages. It uses a transformer encoder-decoder architecture trained on 680,000 hours of multilingual audio data.

अक्सर पूछे जाने वाले प्रश्न

Whisper Large V3 एक भाषण मॉडल है OpenAI द्वारा. STT.ai सेना Whisper Large V3 हमारे जीपी में Whisper Large V3 पर इसलिए आप इसे अपने खुद के हार्डवेयर के बिना प्रयोग कर सकते हैं — ऑडियो अपलोड करें या वीडियो पता लगाने के लिए मॉडल बनाने से 8808080.

मानक Stars पर, ८८०% वचन दर के आसपास Whisper Large V3 प्राप्त करता है. वास्तविक विश्व सटीकता ऑडियो गुणवत्ता, उच्चारण, और भाषा पर निर्भर करता है. आवाज़ या टिप्पणीओं के लिए, कुछ प्रतिशत प्रतिशत प्रतिशत अधिक व विडेंट संकेत की उम्मीद करता है.

Whisper Large V3 runs on STT.ai's free tier — every visitor gets 600 minutes/month at no cost. Paid plans add longer per-file limits, private transcripts, and priority queueing.

Whisper Large V3 को MIT के तहत रिहा किया गया है, एक गलत खुले स्रोत लाइसेंस. आप अपने स्वयं को H-host000 पर कर सकते हैं या हमारे मेजबानित संस्करण का उपयोग कर सकते हैं - दोनों व्यावसायिक रूप से प्रयोग कर रहे हैं.

Whisper Large V3 99 भाषाओं का समर्थन करता है. स्वचालित रूप से ध्वनि के लिए सही भाषा लेता है; आप इसे दस्ती रूप से निर्दिष्ट कर सकते हैं एक छोटी सी सटीकता के लिए.

Whisper Large V3 प्रक्रियाओं के बारे में 8.0x वास्तविक समय हमारे जीपी. एक 1 घंटे की ध्वनि फ़ाइल 7 मिनट में होती है, अब फ़ाइलें कतार में और ईमेल द्वारा सूचना देता है.

Whisper Large V3 में 8800 पैरामीटर हैं. बड़ा मॉडल अधिक सही होने की पुष्टि करता है लेकिन धीमी; STT.ai सेना Whisper Large V3 GUCHU पर तो पैरामीटर नंबर अपने ग्राहक किनारे प्रदर्शन को प्रभावित नहीं करता.

Whisper Large V3 accepts every format STT.ai supports — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and others. Output as TXT, SRT, VTT, DOCX, JSON, or PDF.

वक्‍ता ने हर भाषण के लिए Whisper Large V3 लोगों के पास दौड़ता है — हर वक्‍ता पर लेबल लगाया जाता है और बाद में इन्हें संपादक में बदल सकता है ।

जी. Whisper Large V3 हमारे सफल वातावरण में चला जाता है — ऑडियो को डिफ़ॉल्ट रूप से संसाधित किया जाता है और उसे मिटाया नहीं जाता बिना विशिष्ट स्तर के प्रशिक्षण के लिए प्रयोग किया जाता है.

एक ही ऑडियो के खिलाफ किसी भी अन्य समर्थित मॉडल को चलाने के लिए Whisper Large V3 उपकरण का उपयोग करें - आप Werer, खण्ड गिनती, स्पीकरों, और अंक के विपरीत देखें। Whisper Large V3 v3 बड़ा V3 तुलना आम तौर पर चल रहा है।

हाँ. "8000" मॉडल का मूल्य के रूप में निर्दिष्ट करें /v1/टैक्स अंत बिन्दु पर. पायथन और नोड शामिल है Whisper Large V3 उदाहरण.

हाँ. क्योंकि Whisper Large V3 है MIT-कैम्प्ड, आप यह खुद से शुरू कर सकते हैं. STT.ai के खुले स्रोत पृष्ठ सूची परियोजना रीपोस और वजन. अधिकांश उत्पादन टीमों का उपयोग GUpon, मॉडलpon, मॉडल की मात्रा छोड़ देने के लिए किया गया संस्करण, और ops.