से ट्रांसक्राइब करें Distil-Whisper

सार्वजनिक उपलब्ध ऑडियो व वीडियो के साथ कार्य करता है. वीएनसी सामग्री समर्थित नहीं है.

उन्नत बनाने के लिए उन्नत बनाएँ
Private transcript
चेक के साथ गपशप करें
योजना के साथ ताला खोलें →
फ़ाइल यहाँ क्लिक करें या ब्राउज़ करने के लिए क्लिक करें
एमपी3, W4A, FLAC, एमपी4, एमकेवी, एम. वी.
उन्नत बनाने के लिए उन्नत बनाएँ
Private transcript
चेक के साथ गपशप करें
योजना के साथ ताला खोलें →
उन्नत बनाने के लिए उन्नत बनाएँ
रिकार्डिंग: 0:00
रीयल- टाइम वोस्क (प्रयोग में)
एनहैंस्ड Whisper (सटीक)
सार्वजनिक लिंक: 24h, पाठ सिर्फ · ऊपर हस्ताक्षर करें 7d + ऑडियो के लिए · प्रोग्रेड निजी कड़ियों के लिए

पाठ को सही तरह से बोलने के लिए सही समय. एआई स्वचालित सुधार जैसे आप बोलते हैं - सही भाषा के साथ सुधार.

अपना माइक्रोफोन पहले टेस्ट करें
❤️ अपने दोस्तों को बताओ!
आप अपने मुफ्त विज्ञापन इस्तेमाल किया है

600 मिनट/ माह पाने के लिए मुफ्त का हस्ताक्षर, या असीमित जाँच के लिए उन्नत.

10 खाली मि. / दिन साइन अप के साथ 600 मिनट मुक्त कोई क्रेडिट कार्ड नहीं गुप्त
मुक्त साइन अप →
5.8%
WER
99
Languages
48.0x
Speed
MIT
License

के बारे में Distil-Whisper

Distil-Whisper is a distilled version of Whisper created by Hugging Face. It reduces the model size by 49% and achieves 6x faster inference while maintaining within 1% WER of the original Whisper Large V2 on out-of-distribution evaluation sets.

अक्सर पूछे जाने वाले प्रश्न

Distil-Whisper एक भाषण मॉडल है Hugging Face द्वारा. STT.ai सेना Distil-Whisper हमारे जीपी में Distil-Whisper पर इसलिए आप इसे अपने खुद के हार्डवेयर के बिना प्रयोग कर सकते हैं — ऑडियो अपलोड करें या वीडियो पता लगाने के लिए मॉडल बनाने से 8808080.

मानक Stars पर, ८८०% वचन दर के आसपास Distil-Whisper प्राप्त करता है. वास्तविक विश्व सटीकता ऑडियो गुणवत्ता, उच्चारण, और भाषा पर निर्भर करता है. आवाज़ या टिप्पणीओं के लिए, कुछ प्रतिशत प्रतिशत प्रतिशत अधिक व विडेंट संकेत की उम्मीद करता है.

Distil-Whisper runs on STT.ai's free tier — every visitor gets 600 minutes/month at no cost. Paid plans add longer per-file limits, private transcripts, and priority queueing.

Distil-Whisper को MIT के तहत रिहा किया गया है, एक गलत खुले स्रोत लाइसेंस. आप अपने स्वयं को H-host000 पर कर सकते हैं या हमारे मेजबानित संस्करण का उपयोग कर सकते हैं - दोनों व्यावसायिक रूप से प्रयोग कर रहे हैं.

Distil-Whisper 99 भाषाओं का समर्थन करता है. स्वचालित रूप से ध्वनि के लिए सही भाषा लेता है; आप इसे दस्ती रूप से निर्दिष्ट कर सकते हैं एक छोटी सी सटीकता के लिए.

Distil-Whisper प्रक्रियाओं के बारे में 48.0x वास्तविक समय हमारे जीपी. एक 1 घंटे की ध्वनि फ़ाइल 1 मिनट में होती है, अब फ़ाइलें कतार में और ईमेल द्वारा सूचना देता है.

Distil-Whisper में 8800 पैरामीटर हैं. बड़ा मॉडल अधिक सही होने की पुष्टि करता है लेकिन धीमी; STT.ai सेना Distil-Whisper GUCHU पर तो पैरामीटर नंबर अपने ग्राहक किनारे प्रदर्शन को प्रभावित नहीं करता.

Distil-Whisper accepts every format STT.ai supports — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and others. Output as TXT, SRT, VTT, DOCX, JSON, or PDF.

वक्‍ता ने हर भाषण के लिए Distil-Whisper लोगों के पास दौड़ता है — हर वक्‍ता पर लेबल लगाया जाता है और बाद में इन्हें संपादक में बदल सकता है ।

जी. Distil-Whisper हमारे सफल वातावरण में चला जाता है — ऑडियो को डिफ़ॉल्ट रूप से संसाधित किया जाता है और उसे मिटाया नहीं जाता बिना विशिष्ट स्तर के प्रशिक्षण के लिए प्रयोग किया जाता है.

एक ही ऑडियो के खिलाफ किसी भी अन्य समर्थित मॉडल को चलाने के लिए Distil-Whisper उपकरण का उपयोग करें - आप Werer, खण्ड गिनती, स्पीकरों, और अंक के विपरीत देखें। Distil-Whisper v3 बड़ा V3 तुलना आम तौर पर चल रहा है।

हाँ. "8000" मॉडल का मूल्य के रूप में निर्दिष्ट करें /v1/टैक्स अंत बिन्दु पर. पायथन और नोड शामिल है Distil-Whisper उदाहरण.

हाँ. क्योंकि Distil-Whisper है MIT-कैम्प्ड, आप यह खुद से शुरू कर सकते हैं. STT.ai के खुले स्रोत पृष्ठ सूची परियोजना रीपोस और वजन. अधिकांश उत्पादन टीमों का उपयोग GUpon, मॉडलpon, मॉडल की मात्रा छोड़ देने के लिए किया गया संस्करण, और ops.