ഉപയോഗിച്ച് ട്രാൻസ്ക്രൈബ് Vosk
12.0%
WER
20
Languages
100.0x
Speed
Apache 2.0
License
കുറിച്ച് Vosk
Vosk is an offline speech recognition toolkit that works without an internet connection. It supports 20+ languages with compact models that can run on mobile devices, Raspberry Pi, and any platform. Built on Kaldi and Zipformer architectures.
പിന്തുണയ്ക്കുന്ന ഭാഷകൾ Vosk
Model Info
- ProviderAlpha Cephei
- Architecture-
- LicenseApache 2.0
- UpdatedMar 2026
പതിവുചോദിക്കുന്ന ചോദ്യങ്ങള്
Vosk ഒരു പ്രസംഗ-വാചക മാതൃകയാണ്. Alpha Cephei STT.ai STT.ai ആതിഥേയന്മാര് നമ്മുടെ GPUM-ല് അത് ഉപയോഗിക്കാന് കഴിയും. അതുകൊണ്ട് നിങ്ങളുടെ സ്വന്തം ഹാര്ഡുവെയര് നല്കാതെ നിങ്ങള്ക്ക് ഇത് ഉപയോഗിക്കാം. ഓഡിയോ വീഡിയോയോ അപ്ലോഡ് ചെയ്യുക. Vosk മോണിറ്ററില് നിന്നും എടുക്കാം.
സ്റ്റാന്ഡേര്ഡ് ബെഞ്ച് മാര്ക്കില്, Vosk വര്ക്ക് 12.0% വാല്യത്തിന്റെ പിശകുകള് ഉണ്ടാകുന്നു. യഥാര്ത്ഥ-ലോക കൃത്യത ഓഡിയോ ഗുണഗണത്തെയും ഭാഷയെയും ആശ്രയിച്ചിരിക്കുന്നു. ശബ്ദമോ ഉദ്ധരിച്ചോ റെക്കോര്ഡ് ചെയ്തോ ചില ശതമാനം പോയിന്റുകള് പ്രതീക്ഷിക്കുന്നു.
Vosk STT.ai-ന്റെ സ്വതന്ത്ര ടൈലറില് പ്രവര്ത്തിക്കും. ഓരോ സന്ദര്ശകന്നും 600 മിനിറ്റ്/മാസം വില നല്കാതെ വരും. പായ്ഡ് പദ്ധതികള് ഒരു ഫയല് പരിധികളും സ്വകാര്യ റെക്കോര്ഡുകളും മുന്ഗണനയും കൂടി കൂട്ടുന്നു.
Apache 2.0 ല് നിന്നും Vosk റിസള്ട്ട് ചെയ്യുന്നു. നിങ്ങള്ക്ക് സ്വന്തം ഹാര്ഡ്വെയര് Vosk ഉപയോഗിക്കാം അല്ലെങ്കില് നമ്മുടെ ഹോര്ഡ്വെയര് പതിപ്പ് ഉപയോഗിക്കാം. രണ്ടും വാണിജ്യപരമായി ഉപയോഗിക്കാം.
20 ഭാഷകള് പിന്തുണയ്ക്കുന്നു Vosk. മിക്ക ശബ്ദങ്ങള്ക്കും ശരിയായ ഭാഷ തെരഞ്ഞെടുക്കുന്നു; നിങ്ങള്ക്കു് ഒരു ചെറിയ സാങ്കേതിക സ്ക്രീനില് സ്വയമായി വ്യക്തമാക്കാം.
നമ്മുടെ GPUS-ല് Vosk ഓഡിയോ ഓഡിയോ ഓഡിയോ ഫയല് അവസാനിക്കുന്നു. ഒരു 1- മണിക്കൂര് ഓഡിയോ ഫയല് 8802 മിനിട്ടില് അവസാനിക്കുന്നു; ദീര്ഘമായ ഫയലുകള് ഇമെയില് വരുമ്പോള് അറിയിക്കുന്നു.
Vosk-നു് 50M പരാമീറ്ററുകള് ഉണ്ട്. വലിയ മോഡലുകള് കൂടുതല് കൃത്യതയുള്ളതായിരിക്കും, പക്ഷെ വേഗത കുറവാണു്; STT.ai ഹോസ്റ്റുകള് GPU യിലെ 8Vosk ആയതിനാല് പരാമീറ്റര് എണ്ണം നിങ്ങളുടെ ക്ലയന്റിന്റെ വശത്തെ പ്രകടനത്തെ ബാധിക്കുന്നില്ല.
Vosk എല്ലാ രീതിയിലും STT.ai പിന്തുണ സ്വീകരിക്കുന്നു — MP3, WAV, MAG, OGG, OGG4, MMCV, MOV, MOV, വെബ്എം, എവിഐ, മറ്റ്വ. ടിഎക്സ്, SXT, DOT, DCX, VX, JSON അല്ലെങ്കില് അല്ലെങ്കില്.
ഓരോ പ്രഭാഷകനും Vosk - ത്തോളം പ്രഭാഷണം നടത്തുന്നു.
യെസ്. Vosk നമ്മുടെ പരിസ്ഥിതിയില് പ്രവര്ത്തിക്കുന്നുണ്ട്. ഓഡിയോ പ്രവര്ത്തനത്തില് സഹജമായി വെട്ടിമാറ്റി നീക്കം ചെയ്യുന്നു. വ്യക്തമായും പരിശീലനം ലഭിക്കാന് ഉപയോഗിക്കാറില്ല. പ്രോപ്ലേ പ്രോജക്റ്റുകള് ക്ളൈന്റെ ഇടതുഭാഗത്തുള്ള എന്ക്രിപ്റ്റിന്റെ രഹസ്യഭാഷ കൂട്ടിച്ചേര്ക്കുക.
മറ്റൊരു ഓഡിയോയില് പിന്തുണയുള്ള Vosk മോഡിഫയര് പ്രവര്ത്തിപ്പിക്കാനുള്ള Vosk ഉപകരണം ഉപയോഗിയ്ക്കുക. നിങ്ങള്ക്കു് WER, ഭാഗസംഖ്യ, ലെറ്റര് ലേബല്, ആത്മവിശ്വാസം എന്നിവ കാണാം. Vosk vs vs vs vs vs വലിയ Vsper v3 സാധാരണയായി പ്രവര്ത്തിക്കുന്നതാണു്.
അതെ, /v1/traannation സൂചികയില് "vosk" പരാമീറ്റര് ആയി വ്യക്തമാക്കുക. പൈത്തണ് ആന്ഡ് എഡ്ഡികെസ് Vosk ഉദാഹരണങ്ങള് ഉള്ക്കൊള്ളുന്നു. സ്വതന്ത്ര API സ്ലേറ്റര് 100 min/ മാസങ്ങള് ഉള്പ്പെടുന്നു.
Vosk 8801 Apache 2.0 ലക്ചറന്റ് ആയതിനാല് നിങ്ങള്ക്കത് സ്വയം ഹോസ്റ്റര് ചെയ്യാം. STT.ai തുറക്കുന്ന താള് പ്രോജക്റ്റും തൂക്കവും പട്ടികപ്പെടുത്തുന്നു. മിക്ക ഉല്പാദനങ്ങളും GPUFFS, മോഡല് സ്യൂട്ടും, ops എന്നിവ ഒഴിവാക്കാന് നമ്മുടെ ഹോസ്റ്റര് ഫോര്ട്ടര് പതിപ്പ് ഉപയോഗിക്കുന്നു.