ഉപയോഗിച്ച് ട്രാൻസ്ക്രൈബ് Whisper Large V3
4.2%
WER
99
Languages
8.0x
Speed
MIT
License
കുറിച്ച് Whisper Large V3
Whisper Large V3 is OpenAI's flagship open-source speech recognition model. With 1.55 billion parameters, it offers exceptional accuracy across 99 languages. It uses a transformer encoder-decoder architecture trained on 680,000 hours of multilingual audio data.
Model Info
- ProviderOpenAI
- Architecture-
- LicenseMIT
- UpdatedMar 2026
പതിവുചോദിക്കുന്ന ചോദ്യങ്ങള്
Whisper Large V3 ഒരു പ്രസംഗ-വാചക മാതൃകയാണ്. OpenAI STT.ai STT.ai ആതിഥേയന്മാര് നമ്മുടെ GPUM-ല് അത് ഉപയോഗിക്കാന് കഴിയും. അതുകൊണ്ട് നിങ്ങളുടെ സ്വന്തം ഹാര്ഡുവെയര് നല്കാതെ നിങ്ങള്ക്ക് ഇത് ഉപയോഗിക്കാം. ഓഡിയോ വീഡിയോയോ അപ്ലോഡ് ചെയ്യുക. Whisper Large V3 മോണിറ്ററില് നിന്നും എടുക്കാം.
സ്റ്റാന്ഡേര്ഡ് ബെഞ്ച് മാര്ക്കില്, Whisper Large V3 വര്ക്ക് 4.2% വാല്യത്തിന്റെ പിശകുകള് ഉണ്ടാകുന്നു. യഥാര്ത്ഥ-ലോക കൃത്യത ഓഡിയോ ഗുണഗണത്തെയും ഭാഷയെയും ആശ്രയിച്ചിരിക്കുന്നു. ശബ്ദമോ ഉദ്ധരിച്ചോ റെക്കോര്ഡ് ചെയ്തോ ചില ശതമാനം പോയിന്റുകള് പ്രതീക്ഷിക്കുന്നു.
Whisper Large V3 STT.ai-ന്റെ സ്വതന്ത്ര ടൈലറില് പ്രവര്ത്തിക്കും. ഓരോ സന്ദര്ശകന്നും 600 മിനിറ്റ്/മാസം വില നല്കാതെ വരും. പായ്ഡ് പദ്ധതികള് ഒരു ഫയല് പരിധികളും സ്വകാര്യ റെക്കോര്ഡുകളും മുന്ഗണനയും കൂടി കൂട്ടുന്നു.
MIT ല് നിന്നും Whisper Large V3 റിസള്ട്ട് ചെയ്യുന്നു. നിങ്ങള്ക്ക് സ്വന്തം ഹാര്ഡ്വെയര് Whisper Large V3 ഉപയോഗിക്കാം അല്ലെങ്കില് നമ്മുടെ ഹോര്ഡ്വെയര് പതിപ്പ് ഉപയോഗിക്കാം. രണ്ടും വാണിജ്യപരമായി ഉപയോഗിക്കാം.
99 ഭാഷകള് പിന്തുണയ്ക്കുന്നു Whisper Large V3. മിക്ക ശബ്ദങ്ങള്ക്കും ശരിയായ ഭാഷ തെരഞ്ഞെടുക്കുന്നു; നിങ്ങള്ക്കു് ഒരു ചെറിയ സാങ്കേതിക സ്ക്രീനില് സ്വയമായി വ്യക്തമാക്കാം.
നമ്മുടെ GPUS-ല് Whisper Large V3 ഓഡിയോ ഓഡിയോ ഓഡിയോ ഫയല് അവസാനിക്കുന്നു. ഒരു 1- മണിക്കൂര് ഓഡിയോ ഫയല് 8802 മിനിട്ടില് അവസാനിക്കുന്നു; ദീര്ഘമായ ഫയലുകള് ഇമെയില് വരുമ്പോള് അറിയിക്കുന്നു.
Whisper Large V3-നു് 1.55B പരാമീറ്ററുകള് ഉണ്ട്. വലിയ മോഡലുകള് കൂടുതല് കൃത്യതയുള്ളതായിരിക്കും, പക്ഷെ വേഗത കുറവാണു്; STT.ai ഹോസ്റ്റുകള് GPU യിലെ 8Whisper Large V3 ആയതിനാല് പരാമീറ്റര് എണ്ണം നിങ്ങളുടെ ക്ലയന്റിന്റെ വശത്തെ പ്രകടനത്തെ ബാധിക്കുന്നില്ല.
Whisper Large V3 എല്ലാ രീതിയിലും STT.ai പിന്തുണ സ്വീകരിക്കുന്നു — MP3, WAV, MAG, OGG, OGG4, MMCV, MOV, MOV, വെബ്എം, എവിഐ, മറ്റ്വ. ടിഎക്സ്, SXT, DOT, DCX, VX, JSON അല്ലെങ്കില് അല്ലെങ്കില്.
ഓരോ പ്രഭാഷകനും Whisper Large V3 - ത്തോളം പ്രഭാഷണം നടത്തുന്നു.
യെസ്. Whisper Large V3 നമ്മുടെ പരിസ്ഥിതിയില് പ്രവര്ത്തിക്കുന്നുണ്ട്. ഓഡിയോ പ്രവര്ത്തനത്തില് സഹജമായി വെട്ടിമാറ്റി നീക്കം ചെയ്യുന്നു. വ്യക്തമായും പരിശീലനം ലഭിക്കാന് ഉപയോഗിക്കാറില്ല. പ്രോപ്ലേ പ്രോജക്റ്റുകള് ക്ളൈന്റെ ഇടതുഭാഗത്തുള്ള എന്ക്രിപ്റ്റിന്റെ രഹസ്യഭാഷ കൂട്ടിച്ചേര്ക്കുക.
മറ്റൊരു ഓഡിയോയില് പിന്തുണയുള്ള Whisper Large V3 മോഡിഫയര് പ്രവര്ത്തിപ്പിക്കാനുള്ള Whisper Large V3 ഉപകരണം ഉപയോഗിയ്ക്കുക. നിങ്ങള്ക്കു് WER, ഭാഗസംഖ്യ, ലെറ്റര് ലേബല്, ആത്മവിശ്വാസം എന്നിവ കാണാം. Whisper Large V3 vs vs vs vs vs വലിയ Vsper v3 സാധാരണയായി പ്രവര്ത്തിക്കുന്നതാണു്.
അതെ, /v1/traannation സൂചികയില് "whisper-large-v3" പരാമീറ്റര് ആയി വ്യക്തമാക്കുക. പൈത്തണ് ആന്ഡ് എഡ്ഡികെസ് Whisper Large V3 ഉദാഹരണങ്ങള് ഉള്ക്കൊള്ളുന്നു. സ്വതന്ത്ര API സ്ലേറ്റര് 100 min/ മാസങ്ങള് ഉള്പ്പെടുന്നു.
Whisper Large V3 8801 MIT ലക്ചറന്റ് ആയതിനാല് നിങ്ങള്ക്കത് സ്വയം ഹോസ്റ്റര് ചെയ്യാം. STT.ai തുറക്കുന്ന താള് പ്രോജക്റ്റും തൂക്കവും പട്ടികപ്പെടുത്തുന്നു. മിക്ക ഉല്പാദനങ്ങളും GPUFFS, മോഡല് സ്യൂട്ടും, ops എന്നിവ ഒഴിവാക്കാന് നമ്മുടെ ഹോസ്റ്റര് ഫോര്ട്ടര് പതിപ്പ് ഉപയോഗിക്കുന്നു.