ഉപയോഗിച്ച് ട്രാൻസ്ക്രൈബ് Distil-Whisper
5.8%
WER
99
Languages
48.0x
Speed
MIT
License
കുറിച്ച് Distil-Whisper
Distil-Whisper is a distilled version of Whisper created by Hugging Face. It reduces the model size by 49% and achieves 6x faster inference while maintaining within 1% WER of the original Whisper Large V2 on out-of-distribution evaluation sets.
Model Info
- ProviderHugging Face
- Architecture-
- LicenseMIT
- UpdatedMar 2026
പതിവുചോദിക്കുന്ന ചോദ്യങ്ങള്
Distil-Whisper ഒരു പ്രസംഗ-വാചക മാതൃകയാണ്. Hugging Face STT.ai STT.ai ആതിഥേയന്മാര് നമ്മുടെ GPUM-ല് അത് ഉപയോഗിക്കാന് കഴിയും. അതുകൊണ്ട് നിങ്ങളുടെ സ്വന്തം ഹാര്ഡുവെയര് നല്കാതെ നിങ്ങള്ക്ക് ഇത് ഉപയോഗിക്കാം. ഓഡിയോ വീഡിയോയോ അപ്ലോഡ് ചെയ്യുക. Distil-Whisper മോണിറ്ററില് നിന്നും എടുക്കാം.
സ്റ്റാന്ഡേര്ഡ് ബെഞ്ച് മാര്ക്കില്, Distil-Whisper വര്ക്ക് 5.8% വാല്യത്തിന്റെ പിശകുകള് ഉണ്ടാകുന്നു. യഥാര്ത്ഥ-ലോക കൃത്യത ഓഡിയോ ഗുണഗണത്തെയും ഭാഷയെയും ആശ്രയിച്ചിരിക്കുന്നു. ശബ്ദമോ ഉദ്ധരിച്ചോ റെക്കോര്ഡ് ചെയ്തോ ചില ശതമാനം പോയിന്റുകള് പ്രതീക്ഷിക്കുന്നു.
Distil-Whisper STT.ai-ന്റെ സ്വതന്ത്ര ടൈലറില് പ്രവര്ത്തിക്കും. ഓരോ സന്ദര്ശകന്നും 600 മിനിറ്റ്/മാസം വില നല്കാതെ വരും. പായ്ഡ് പദ്ധതികള് ഒരു ഫയല് പരിധികളും സ്വകാര്യ റെക്കോര്ഡുകളും മുന്ഗണനയും കൂടി കൂട്ടുന്നു.
MIT ല് നിന്നും Distil-Whisper റിസള്ട്ട് ചെയ്യുന്നു. നിങ്ങള്ക്ക് സ്വന്തം ഹാര്ഡ്വെയര് Distil-Whisper ഉപയോഗിക്കാം അല്ലെങ്കില് നമ്മുടെ ഹോര്ഡ്വെയര് പതിപ്പ് ഉപയോഗിക്കാം. രണ്ടും വാണിജ്യപരമായി ഉപയോഗിക്കാം.
99 ഭാഷകള് പിന്തുണയ്ക്കുന്നു Distil-Whisper. മിക്ക ശബ്ദങ്ങള്ക്കും ശരിയായ ഭാഷ തെരഞ്ഞെടുക്കുന്നു; നിങ്ങള്ക്കു് ഒരു ചെറിയ സാങ്കേതിക സ്ക്രീനില് സ്വയമായി വ്യക്തമാക്കാം.
നമ്മുടെ GPUS-ല് Distil-Whisper ഓഡിയോ ഓഡിയോ ഓഡിയോ ഫയല് അവസാനിക്കുന്നു. ഒരു 1- മണിക്കൂര് ഓഡിയോ ഫയല് 8802 മിനിട്ടില് അവസാനിക്കുന്നു; ദീര്ഘമായ ഫയലുകള് ഇമെയില് വരുമ്പോള് അറിയിക്കുന്നു.
Distil-Whisper-നു് 756M പരാമീറ്ററുകള് ഉണ്ട്. വലിയ മോഡലുകള് കൂടുതല് കൃത്യതയുള്ളതായിരിക്കും, പക്ഷെ വേഗത കുറവാണു്; STT.ai ഹോസ്റ്റുകള് GPU യിലെ 8Distil-Whisper ആയതിനാല് പരാമീറ്റര് എണ്ണം നിങ്ങളുടെ ക്ലയന്റിന്റെ വശത്തെ പ്രകടനത്തെ ബാധിക്കുന്നില്ല.
Distil-Whisper എല്ലാ രീതിയിലും STT.ai പിന്തുണ സ്വീകരിക്കുന്നു — MP3, WAV, MAG, OGG, OGG4, MMCV, MOV, MOV, വെബ്എം, എവിഐ, മറ്റ്വ. ടിഎക്സ്, SXT, DOT, DCX, VX, JSON അല്ലെങ്കില് അല്ലെങ്കില്.
ഓരോ പ്രഭാഷകനും Distil-Whisper - ത്തോളം പ്രഭാഷണം നടത്തുന്നു.
യെസ്. Distil-Whisper നമ്മുടെ പരിസ്ഥിതിയില് പ്രവര്ത്തിക്കുന്നുണ്ട്. ഓഡിയോ പ്രവര്ത്തനത്തില് സഹജമായി വെട്ടിമാറ്റി നീക്കം ചെയ്യുന്നു. വ്യക്തമായും പരിശീലനം ലഭിക്കാന് ഉപയോഗിക്കാറില്ല. പ്രോപ്ലേ പ്രോജക്റ്റുകള് ക്ളൈന്റെ ഇടതുഭാഗത്തുള്ള എന്ക്രിപ്റ്റിന്റെ രഹസ്യഭാഷ കൂട്ടിച്ചേര്ക്കുക.
മറ്റൊരു ഓഡിയോയില് പിന്തുണയുള്ള Distil-Whisper മോഡിഫയര് പ്രവര്ത്തിപ്പിക്കാനുള്ള Distil-Whisper ഉപകരണം ഉപയോഗിയ്ക്കുക. നിങ്ങള്ക്കു് WER, ഭാഗസംഖ്യ, ലെറ്റര് ലേബല്, ആത്മവിശ്വാസം എന്നിവ കാണാം. Distil-Whisper vs vs vs vs vs വലിയ Vsper v3 സാധാരണയായി പ്രവര്ത്തിക്കുന്നതാണു്.
അതെ, /v1/traannation സൂചികയില് "distil-whisper" പരാമീറ്റര് ആയി വ്യക്തമാക്കുക. പൈത്തണ് ആന്ഡ് എഡ്ഡികെസ് Distil-Whisper ഉദാഹരണങ്ങള് ഉള്ക്കൊള്ളുന്നു. സ്വതന്ത്ര API സ്ലേറ്റര് 100 min/ മാസങ്ങള് ഉള്പ്പെടുന്നു.
Distil-Whisper 8801 MIT ലക്ചറന്റ് ആയതിനാല് നിങ്ങള്ക്കത് സ്വയം ഹോസ്റ്റര് ചെയ്യാം. STT.ai തുറക്കുന്ന താള് പ്രോജക്റ്റും തൂക്കവും പട്ടികപ്പെടുത്തുന്നു. മിക്ക ഉല്പാദനങ്ങളും GPUFFS, മോഡല് സ്യൂട്ടും, ops എന്നിവ ഒഴിവാക്കാന് നമ്മുടെ ഹോസ്റ്റര് ഫോര്ട്ടര് പതിപ്പ് ഉപയോഗിക്കുന്നു.