સાથે લખો Distil-Whisper

Name: Distil-Whisper
Author: Hugging Face

જાહેર ઉપલબ્ધ ઓડિયો અને વિડિયો સાથે કામ કરે છે. DRM-સુરક્ષિત સમાવિષ્ટો આધારભૂત નથી.

વધારા માટે સુધારો

ખાનગી ટ્રાન્સક્રિપ્ટ

ટ્રાન્સક્રિપ્ટ સાથે વાતચીત કરો

Pro સાથે તાળુ ખોલો →

ફાઇલ અહીં મૂકો અથવા બ્રાઉઝ કરવા માટે ક્લિક કરો

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — ૨GB સુધી

બહુવિધ ફાઇલોને બેચ અપલોડ કરો પ્રો સાથે

વધારા માટે સુધારો

ખાનગી ટ્રાન્સક્રિપ્ટ

ટ્રાન્સક્રિપ્ટ સાથે વાતચીત કરો

Pro સાથે તાળુ ખોલો →

વધારા માટે સુધારો

લખાણમાં વાસ્તવિક સમયની બોલી. AI આપોઆપ-સમાધાન કરે છે જેમ તમે બોલો છો - લાંબી બોલી સાથે ચોકસાઈ સુધરે છે.

તમારું માઇક્રોફોન પહેલેથી ચકાસો

૧૦ મુક્ત મિનિટ/દિવસ નોંધણી સાથે 600 મિનિટ મુક્ત ક્રેડિટ કાર્ડ નથી એનક્રિપ્ટ થયેલ

મફત નોંધણી કરો →

5.8%

WER

ભાષાઓ

48.0x

ઝડપ

MIT

લાઇસન્સ

વિશે Distil-Whisper

Distil-Whisper એ Hugging Face દ્વારા બનાવેલ Whisper ની ડિસ્ટિલ કરેલ આવૃત્તિ છે. તે મોડેલ માપને 49% થી ઘટાડે છે અને 6x ઝડપી અંદાજને પ્રાપ્ત કરે છે જ્યારે બહાર-અને-વિતરણ મૂલ્યાંકન સમૂહો પર મૂળ Whisper Large V2 ની 1% WER ની અંદર જાળવી રાખે છે.

આના દ્વારા આધારિત ભાષાઓ Distil-Whisper

અંગ્રેજી

સ્પેનિશ

ફ્રેન્ચ

જર્મન

ચાઇનીઝ

જાપાનીઝ

કોરિયન

પોર્ટુગીઝ

અરબી

હિન્દી

રશિયન

ઇટાલિયન

ડચ

ટર્કિશ

પોલીશ

સ્વીડિશ

ઇન્ડોનેશિયન

થાઈ

વિયેતનામીસ

ચેક

ગ્રીક

રોમાનિયન

હંગેરિયન

હીબ્રુ

ડેનિશ

ફિનિશ

નૉર્વેજીયન

યુક્રેનિયન

મલય

બાંગ્લા

મોડેલ જાણકારી

પૂરૂં પાડનારHugging Face
આર્કિટેક્ચર-
લાઇસન્સMIT
સુધારેલMar 2026

સંબંધિત મોડેલો

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

વારંવાર પૂછાતા પ્રશ્નો

Distil-Whisper એ Hugging Face દ્દારા બોલી-થી-લખાણ મોડેલ છે. STT.ai એ અમારા GPU ઇન્ફ્રાસ્ટ્રક્ચર પર Distil-Whisper ને યજમાન બનાવે છે જેથી તમે તમારા પોતાના હાર્ડવેર પૂરુ પાડ્યા વિના તેને વાપરી શકો - ઓડિયો અથવા વિડિયો અપલોડ કરો અને મોડેલ પસંદ કરનારમાંથી Distil-Whisper ને પસંદ કરો.

પ્રમાણભૂત બેન્ચમાર્ક પર, Distil-Whisper એ 5.8% શબ્દ ભૂલ દરને આસપાસ મેળવે છે. વાસ્તવિક-વિશ્વની ચોકસાઈ ઓડિયો ગુણવત્તા, ઉચ્ચારણ અને ભાષા પર આધારિત છે; ધુમાડાવાળા અથવા ઉચ્ચારણવાળા રેકોર્ડિંગ માટે, થોડા ટકા પોઇન્ટ્સ ઊંચા WER ની અપેક્ષા રાખો.

Distil-Whisper STT.ai ની મુક્ત સ્તર પર ચલાવે છે - દરેક મુલાકાતીને કોઈ ખર્ચ વગર શરૂ કરવા માટે 600 મિનિટ મળે છે. ચૂકવેલ યોજનાઓ ફાઇલ પ્રતિ લાંબી મર્યાદાઓ, ખાનગી ટ્રાન્સક્રિપ્ટ્સ, અને પ્રાથમિકતા કતાર ઉમેરવા માટે.

Distil-Whisper MIT ની નીચે બહાર પાડવામાં આવે છે, એક પરવાનગી આપતી ઓપન-સોર્સ લાઇસન્સ. તમે તમારા પોતાના હાર્ડવેરમાં Distil-Whisper ને સ્વયં-હોસ્ટ કરી શકો છો અથવા અમારી હોસ્ટ કરેલ આવૃત્તિનો ઉપયોગ કરી શકો છો - બંને વાણિજ્યિક રીતે ઉપયોગી છે.

Distil-Whisper 99 ભાષાઓને આધાર આપે છે. આપમેળે-શોધ એ મોટાભાગના ઓડિયો માટે સાચી ભાષા પસંદ કરે છે; તમે તેને નાની ચોકસાઈ માટે જાતે પણ સ્પષ્ટ કરી શકો છો.

Distil-Whisper ઓડિયો પ્રક્રિયાઓ અમારા GPUs પર 48.0x વાસ્તવિક સમય પર. 1-કલાકની ઓડિયો ફાઈલ 1 મિનિટમાં સમાપ્ત થાય છે; લાંબી ફાઈલો કતારમાં અને જ્યારે પૂર્ણ થાય ત્યારે ઈમેઈલ દ્વારા સૂચિત કરે છે.

Distil-Whisper પાસે 756M પરિમાણો છે. મોટા મોડેલો વધુ ચોક્કસ હોય છે પરંતુ ધીમા; STT.ai GPU પર Distil-Whisper યજમાન છે તેથી પરિમાણ ગણતરી તમારી ક્લાયન્ટ-સાઇડ કાર્યક્ષમતા અસર કરતી નથી.

Distil-Whisper દરેક બંધારણને સ્વીકારે છે કે જે STT.ai આધાર આપે છે — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, અને અન્ય. આઉટપુટ TXT, SRT, VTT, DOCX, JSON, અથવા PDF તરીકે.

હા. સ્પીકર ડેટાબેઝ દરેક અનુવાદ માટે Distil-Whisper ની સાથે ચાલે છે - દરેક સ્પીકર ને લેબલ કરેલ છે અને તમે પછી સંપાદકમાં તેનું નામ બદલી શકો છો.

હા. Distil-Whisper અમારા સંચાલિત વાતાવરણમાં ચાલે છે - ઓડિયો મૂળભૂત રીતે પ્રક્રિયા કરેલ છે અને કાઢી નાખવામાં આવે છે અને સ્પષ્ટ રીતે પસંદગી કર્યા વિના તાલીમ માટે ક્યારેય વપરાય નહિં. પ્રો યોજનાઓ અસ્થિર ટ્રાન્સક્રિપ્ટ્સ માટે ક્લાયન્ટ-સાઇડ એનક્રિપ્શન ઉમેરે છે.

Distil-Whisper ને કોઈપણ અન્ય આધારભૂત મોડેલ સામે એ જ ઓડિયો પર ચલાવવા માટે સરખામણી-stt સાધનનો ઉપયોગ કરો - તમે WER, સેગમેન્ટ ગણતરી, સ્પીકર લેબલ્સ, અને વિશ્વાસ સ્કોર બાજુ-બે-બાજુ જોશો. Distil-Whisper વિ Whisper Large V3 સરખામણી સૌથી સામાન્ય રીતે ચલાવે છે.

હા. /v1/transcribe અંતિમબિંદુ પર મોડેલ પરિમાણ તરીકે "distil-whisper" ને સ્પષ્ટ કરો. Python અને Node.js SDKs Distil-Whisper ઉદાહરણો સમાવે છે. મુક્ત API સ્તરમાં 100 મિનિટ/મહિના સમાવે છે.

હા. કારણ કે Distil-Whisper એ MIT-લાઇસન્સ થયેલ છે, તમે તેને સ્વયં-હોસ્ટ કરી શકો છો. STT.ai નું ઓપન-સોર્સ પાનું પ્રોજેક્ટ રેપો અને વજનોની યાદી કરે છે. મોટાભાગના ઉત્પાદન ટીમો GPU ખરીદી, મોડેલ સ્વેપ અને ઓપસને છોડવા માટે અમારી યજમાન આવૃત્તિ વાપરે છે.

સાથે લખો Distil-Whisper

વિશે Distil-Whisper

આના દ્વારા આધારિત ભાષાઓ Distil-Whisper

મોડેલ જાણકારી

સંબંધિત મોડેલો

વારંવાર પૂછાતા પ્રશ્નો

Distil-Whisper શું છે?

Distil-Whisper કેટલું ચોક્કસ છે?

શું Distil-Whisper વાપરવા માટે મુક્ત છે?

Distil-Whisper કઈ લાઇસન્સ વાપરે છે?

કેટલી ભાષાઓ Distil-Whisper આધાર આપે છે?

Distil-Whisper કેટલું ઝડપી છે?

Distil-Whisper મોડેલ કેટલું મોટું છે?

કયા ઓડિયો બંધારણો Distil-Whisper રૂપાંતરિત કરી શકે છે?

શું Distil-Whisper ઘણાબધા સ્પીકર શોધે છે?

શું મારી માહિતી ખાનગી છે જ્યારે Distil-Whisper વાપરી રહ્યા હોય?

Distil-Whisper અન્ય STT મોડેલોની સરખામણીમાં કેવી રીતે છે?

શું હું API મારફતે Distil-Whisper વાપરી શકું?

શું હું મારા પોતાના સર્વર પર Distil-Whisper ચલાવી શકું?