के साथ स्केल करें Distil-Whisper

Name: Distil-Whisper
Author: Hugging Face

सार्वजनिक उपलब्ध ऑडियो व वीडियो के साथ कार्य करता है. वीएनसी सामग्री समर्थित नहीं है.

उन्नत बनाने के लिए उन्नत बनाएँ

निजी उच्चारण

चेक के साथ गपशप करें

योजना के साथ ताला खोलें →

फ़ाइल यहाँ क्लिक करें या ब्राउज़ करने के लिए क्लिक करें

एमपी3, W4A, FLAC, एमपी4, एमकेवी, एम. वी.

बहुत से फ़ाइलों को डाउनलोड किया जा रहा है प्रारंभ में

उन्नत बनाने के लिए उन्नत बनाएँ

निजी उच्चारण

चेक के साथ गपशप करें

योजना के साथ ताला खोलें →

उन्नत बनाने के लिए उन्नत बनाएँ

पाठ को सही तरह से बोलने के लिए सही समय. एआई स्वचालित सुधार जैसे आप बोलते हैं - सही भाषा के साथ सुधार.

अपना माइक्रोफोन पहले टेस्ट करें

10 खाली मि. / दिन साइन अप के साथ 600 मिनट मुक्त कोई क्रेडिट कार्ड नहीं गुप्त

मुक्त साइन अप →

5.8%

WER

भाषाएँ

48.0x

गति

MIT

लाइसेंस

के बारे में Distil-Whisper

Dinging चेहरे द्वारा बनाई गई थी. यह पैटर्न आकार को कम करता है 49% द्वारा बनाया गया है और 1% के भीतर बनाए रखने के दौरान 6x तेजी से प्राप्त करता है। मूल serv2 बड़े वी2 की जाँच सेट पर।

भाषाएँ जो समर्थित है Distil-Whisper

अंग्रेज़ी

स्पेनिश

फ़्रेंच

जर्मन

चीनी

जापानी

कोरियाई

पुर्तगाली

अरबी

हिन्दी

रूसी

इतालवी

डच

तुर्की

पोलिश

स्वीडिश

इंडोनेशियाई

थाई

वियतनामी

चेक

यूनानी

रोमानियाई

हंगेरियाई

हिब्रू

डेनिश

फ़िनिश

नॉर्वेजियाई

यूक्रेनियाई

मलय

बंगाली

मॉडल जानकारी

प्रदाताHugging Face
स्फीति-
लाइसेंसMIT
अद्यतन किया गयाMar 2026

अक्सर पूछे जाने वाले प्रश्न

Distil-Whisper एक भाषण मॉडल है Hugging Face द्वारा. STT.ai सेना Distil-Whisper हमारे जीपी में Distil-Whisper पर इसलिए आप इसे अपने खुद के हार्डवेयर के बिना प्रयोग कर सकते हैं — ऑडियो अपलोड करें या वीडियो पता लगाने के लिए मॉडल बनाने से 8808080.

मानक Stars पर, ८८०% वचन दर के आसपास Distil-Whisper प्राप्त करता है. वास्तविक विश्व सटीकता ऑडियो गुणवत्ता, उच्चारण, और भाषा पर निर्भर करता है. आवाज़ या टिप्पणीओं के लिए, कुछ प्रतिशत प्रतिशत प्रतिशत अधिक व विडेंट संकेत की उम्मीद करता है.

Distil-Whisper runs on STT.ai's free tier — every visitor gets 600 minutes/month at no cost. Paid plans add longer per-file limits, private transcripts, and priority queueing.

Distil-Whisper को MIT के तहत रिहा किया गया है, एक गलत खुले स्रोत लाइसेंस. आप अपने स्वयं को H-host000 पर कर सकते हैं या हमारे मेजबानित संस्करण का उपयोग कर सकते हैं - दोनों व्यावसायिक रूप से प्रयोग कर रहे हैं.

Distil-Whisper 99 भाषाओं का समर्थन करता है. स्वचालित रूप से ध्वनि के लिए सही भाषा लेता है; आप इसे दस्ती रूप से निर्दिष्ट कर सकते हैं एक छोटी सी सटीकता के लिए.

Distil-Whisper प्रक्रियाओं के बारे में 48.0x वास्तविक समय हमारे जीपी. एक 1 घंटे की ध्वनि फ़ाइल 1 मिनट में होती है, अब फ़ाइलें कतार में और ईमेल द्वारा सूचना देता है.

Distil-Whisper में 8800 पैरामीटर हैं. बड़ा मॉडल अधिक सही होने की पुष्टि करता है लेकिन धीमी; STT.ai सेना Distil-Whisper GUCHU पर तो पैरामीटर नंबर अपने ग्राहक किनारे प्रदर्शन को प्रभावित नहीं करता.

Distil-Whisper accepts every format STT.ai supports — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and others. Output as TXT, SRT, VTT, DOCX, JSON, or PDF.

वक्‍ता ने हर भाषण के लिए Distil-Whisper लोगों के पास दौड़ता है — हर वक्‍ता पर लेबल लगाया जाता है और बाद में इन्हें संपादक में बदल सकता है ।

जी. Distil-Whisper हमारे सफल वातावरण में चला जाता है — ऑडियो को डिफ़ॉल्ट रूप से संसाधित किया जाता है और उसे मिटाया नहीं जाता बिना विशिष्ट स्तर के प्रशिक्षण के लिए प्रयोग किया जाता है.

एक ही ऑडियो के खिलाफ किसी भी अन्य समर्थित मॉडल को चलाने के लिए Distil-Whisper उपकरण का उपयोग करें - आप Werer, खण्ड गिनती, स्पीकरों, और अंक के विपरीत देखें। Distil-Whisper v3 बड़ा V3 तुलना आम तौर पर चल रहा है।

हाँ. "8000" मॉडल का मूल्य के रूप में निर्दिष्ट करें /v1/टैक्स अंत बिन्दु पर. पायथन और नोड शामिल है Distil-Whisper उदाहरण.

हाँ. क्योंकि Distil-Whisper है MIT-कैम्प्ड, आप यह खुद से शुरू कर सकते हैं. STT.ai के खुले स्रोत पृष्ठ सूची परियोजना रीपोस और वजन. अधिकांश उत्पादन टीमों का उपयोग GUpon, मॉडलpon, मॉडल की मात्रा छोड़ देने के लिए किया गया संस्करण, और ops.

के साथ स्केल करें Distil-Whisper

के बारे में Distil-Whisper

भाषाएँ जो समर्थित है Distil-Whisper

मॉडल जानकारी

संबंधित मॉडल

अक्सर पूछे जाने वाले प्रश्न

Distil-Whisper क्या है?

कितना सही है Distil-Whisper?

क्या Distil-Whisper का उपयोग करने के लिए स्वतंत्र है?

88,000 लोगों का लाइसेंस क्या है?

कितनी भाषाओं में 88,000 का समर्थन होता है?

कितना तेज Distil-Whisper है?

Distil-Whisper मॉडल कितना बड़ा है?

कौन - से ऑडियो फ़ॉर्मेट ८८००० कैंचन को पढ़ सकते हैं?

क्या Distil-Whisper कई स्पीकरों का पता लगा है?

जब Distil-Whisper का उपयोग कर मेरा डेटा निजी है?

Distil-Whisper की तुलना अन्य स्वर्ट मॉडल से कैसे होती है?

क्या मैं एपीआई के माध्यम से Distil-Whisper का उपयोग कर सकते हैं?

मैं अपने ही सर्वर पर Distil-Whisper000 चला सकते हैं?