ഉപയോഗിച്ച് ട്രാൻസ്ക്രൈബ് SenseVoice
5.5%
WER
50
Languages
50.0x
Speed
MIT
License
കുറിച്ച് SenseVoice
SenseVoice is a speech foundation model from FunAudioLLM that goes beyond transcription. It supports 50+ languages and includes capabilities for emotion recognition, audio event detection, and inverse text normalization in a single model.
Model Info
- ProviderFunAudioLLM
- Architecture-
- LicenseMIT
- UpdatedMar 2026
പതിവുചോദിക്കുന്ന ചോദ്യങ്ങള്
SenseVoice ഒരു പ്രസംഗ-വാചക മാതൃകയാണ്. FunAudioLLM STT.ai STT.ai ആതിഥേയന്മാര് നമ്മുടെ GPUM-ല് അത് ഉപയോഗിക്കാന് കഴിയും. അതുകൊണ്ട് നിങ്ങളുടെ സ്വന്തം ഹാര്ഡുവെയര് നല്കാതെ നിങ്ങള്ക്ക് ഇത് ഉപയോഗിക്കാം. ഓഡിയോ വീഡിയോയോ അപ്ലോഡ് ചെയ്യുക. SenseVoice മോണിറ്ററില് നിന്നും എടുക്കാം.
സ്റ്റാന്ഡേര്ഡ് ബെഞ്ച് മാര്ക്കില്, SenseVoice വര്ക്ക് 5.5% വാല്യത്തിന്റെ പിശകുകള് ഉണ്ടാകുന്നു. യഥാര്ത്ഥ-ലോക കൃത്യത ഓഡിയോ ഗുണഗണത്തെയും ഭാഷയെയും ആശ്രയിച്ചിരിക്കുന്നു. ശബ്ദമോ ഉദ്ധരിച്ചോ റെക്കോര്ഡ് ചെയ്തോ ചില ശതമാനം പോയിന്റുകള് പ്രതീക്ഷിക്കുന്നു.
SenseVoice STT.ai-ന്റെ സ്വതന്ത്ര ടൈലറില് പ്രവര്ത്തിക്കും. ഓരോ സന്ദര്ശകന്നും 600 മിനിറ്റ്/മാസം വില നല്കാതെ വരും. പായ്ഡ് പദ്ധതികള് ഒരു ഫയല് പരിധികളും സ്വകാര്യ റെക്കോര്ഡുകളും മുന്ഗണനയും കൂടി കൂട്ടുന്നു.
MIT ല് നിന്നും SenseVoice റിസള്ട്ട് ചെയ്യുന്നു. നിങ്ങള്ക്ക് സ്വന്തം ഹാര്ഡ്വെയര് SenseVoice ഉപയോഗിക്കാം അല്ലെങ്കില് നമ്മുടെ ഹോര്ഡ്വെയര് പതിപ്പ് ഉപയോഗിക്കാം. രണ്ടും വാണിജ്യപരമായി ഉപയോഗിക്കാം.
50 ഭാഷകള് പിന്തുണയ്ക്കുന്നു SenseVoice. മിക്ക ശബ്ദങ്ങള്ക്കും ശരിയായ ഭാഷ തെരഞ്ഞെടുക്കുന്നു; നിങ്ങള്ക്കു് ഒരു ചെറിയ സാങ്കേതിക സ്ക്രീനില് സ്വയമായി വ്യക്തമാക്കാം.
നമ്മുടെ GPUS-ല് SenseVoice ഓഡിയോ ഓഡിയോ ഓഡിയോ ഫയല് അവസാനിക്കുന്നു. ഒരു 1- മണിക്കൂര് ഓഡിയോ ഫയല് 8802 മിനിട്ടില് അവസാനിക്കുന്നു; ദീര്ഘമായ ഫയലുകള് ഇമെയില് വരുമ്പോള് അറിയിക്കുന്നു.
SenseVoice-നു് 234M പരാമീറ്ററുകള് ഉണ്ട്. വലിയ മോഡലുകള് കൂടുതല് കൃത്യതയുള്ളതായിരിക്കും, പക്ഷെ വേഗത കുറവാണു്; STT.ai ഹോസ്റ്റുകള് GPU യിലെ 8SenseVoice ആയതിനാല് പരാമീറ്റര് എണ്ണം നിങ്ങളുടെ ക്ലയന്റിന്റെ വശത്തെ പ്രകടനത്തെ ബാധിക്കുന്നില്ല.
SenseVoice എല്ലാ രീതിയിലും STT.ai പിന്തുണ സ്വീകരിക്കുന്നു — MP3, WAV, MAG, OGG, OGG4, MMCV, MOV, MOV, വെബ്എം, എവിഐ, മറ്റ്വ. ടിഎക്സ്, SXT, DOT, DCX, VX, JSON അല്ലെങ്കില് അല്ലെങ്കില്.
ഓരോ പ്രഭാഷകനും SenseVoice - ത്തോളം പ്രഭാഷണം നടത്തുന്നു.
യെസ്. SenseVoice നമ്മുടെ പരിസ്ഥിതിയില് പ്രവര്ത്തിക്കുന്നുണ്ട്. ഓഡിയോ പ്രവര്ത്തനത്തില് സഹജമായി വെട്ടിമാറ്റി നീക്കം ചെയ്യുന്നു. വ്യക്തമായും പരിശീലനം ലഭിക്കാന് ഉപയോഗിക്കാറില്ല. പ്രോപ്ലേ പ്രോജക്റ്റുകള് ക്ളൈന്റെ ഇടതുഭാഗത്തുള്ള എന്ക്രിപ്റ്റിന്റെ രഹസ്യഭാഷ കൂട്ടിച്ചേര്ക്കുക.
മറ്റൊരു ഓഡിയോയില് പിന്തുണയുള്ള SenseVoice മോഡിഫയര് പ്രവര്ത്തിപ്പിക്കാനുള്ള SenseVoice ഉപകരണം ഉപയോഗിയ്ക്കുക. നിങ്ങള്ക്കു് WER, ഭാഗസംഖ്യ, ലെറ്റര് ലേബല്, ആത്മവിശ്വാസം എന്നിവ കാണാം. SenseVoice vs vs vs vs vs വലിയ Vsper v3 സാധാരണയായി പ്രവര്ത്തിക്കുന്നതാണു്.
അതെ, /v1/traannation സൂചികയില് "sensevoice" പരാമീറ്റര് ആയി വ്യക്തമാക്കുക. പൈത്തണ് ആന്ഡ് എഡ്ഡികെസ് SenseVoice ഉദാഹരണങ്ങള് ഉള്ക്കൊള്ളുന്നു. സ്വതന്ത്ര API സ്ലേറ്റര് 100 min/ മാസങ്ങള് ഉള്പ്പെടുന്നു.
SenseVoice 8801 MIT ലക്ചറന്റ് ആയതിനാല് നിങ്ങള്ക്കത് സ്വയം ഹോസ്റ്റര് ചെയ്യാം. STT.ai തുറക്കുന്ന താള് പ്രോജക്റ്റും തൂക്കവും പട്ടികപ്പെടുത്തുന്നു. മിക്ക ഉല്പാദനങ്ങളും GPUFFS, മോഡല് സ്യൂട്ടും, ops എന്നിവ ഒഴിവാക്കാന് നമ്മുടെ ഹോസ്റ്റര് ഫോര്ട്ടര് പതിപ്പ് ഉപയോഗിക്കുന്നു.