Transcribe with SenseVoice
5.5%
WER
50
Languages
50.0x
Speed
MIT
License
About SenseVoice
Model Info
- ProviderFunAudioLLM
- Architecture-
- LicenseMIT
- UpdatedMar 2026
නිතර අසන ප්රශ්න
SenseVoice යනු FunAudioLLM විසින් SenseVoice ක් රියාත්මක කරන ලද කථන-පෙළ ආකෘතියකි. STT.ai සත්කාරකත්වය සපයයි SenseVoice අපගේ GPU යටිතල පහසුකම් මත, එබැවින් ඔබට ඔබේම දෘඩාංග සැපයීමකින් තොරව එය භාවිතා කළ හැකිය - ශ්රව්ය හෝ වීඩියෝ උඩුගත කිරීම සහ ආකෘති තෝරාගැනීමෙන් SenseVoice තෝරා ගැනීම.
සම්මත සංගණන මත, SenseVoice 5.5% වචනය දෝෂ අනුපාතය වටා සාක්ෂාත් කර ගනී. සැබෑ ලෝකයේ නිරවද් යතාවය ශ්රව්ය ගුණාත්මකභාවය, හඬ, සහ භාෂාව මත රඳා පවතී; ශබ්ද හෝ හඬ පටිගත කිරීම් සඳහා, ඉහළ WER ප්රතිශතයක් කිහිපයක් බලාපොරොත්තු වන්න.
SenseVoice STT.ai හි නොමිලේ තට්ටුව මත ධාවනය වේ - සෑම සංචාරකයෙකුටම කිසිදු පිරිවැයක් නොමැතිව මිනිත්තු / මාස 600 ලැබේ. ගෙවන සැලසුම් දිගු ගොනු සීමා, පෞද්ගලික පරිවර්තන සහ ප්රමුඛතාවය පෝලිම්ගත කිරීම.
SenseVoice නිදහස් මූලාශ්රය බලපත්රයක් යටතේ නිකුත් කර ඇත MIT, ඉඩ දෙන. ඔබ ඔබේම දෘඩාංග මත ස්වයං-සත්කාරක SenseVoice හෝ අපගේ සත්කාරක අනුවාදය භාවිතා කළ හැකිය - දෙකම වාණිජමය වශයෙන් භාවිතා කළ හැකිය.
SenseVoice 50 භාෂා සහාය. ස්වයංක්රීය හඳුනාගැනීම බොහෝ ශ්රව්ය සඳහා සුදුසු භාෂාව තෝරා; ඔබ ද කුඩා නිරවද් යතාව සෝපානය සඳහා එය අතින් සඳහන් කළ හැකිය.
SenseVoice අපගේ GPUs මත 50.0x තත්ත්ව යටතේ ශ්රව්ය ක්රියාවලිය. 1 පැය ශ්රව්ය ගොනුව 1 මිනිත්තු යටතේ අවසන් වේ; දිගු ගොනු පෝලිමේ සහ අවසන් වූ විට ඊ-තැපැල් මගින් දැනුම් දෙන්න.
SenseVoice 234M පරාමිති ඇත. විශාල ආකෘති වඩා නිවැරදි නමුත් මන්දගාමී විය හැකිය; STT.ai GPU මත SenseVoice සත්කාරකත්වය දරයි, එබැවින් පරාමිති ගණන් කිරීම ඔබේ සේවාදායකයාගේ පැත්තේ කාර්ය සාධනය බලපාන්නේ නැත.
SenseVoice සෑම ආකෘතිය පිළිගනී STT.ai සහාය - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, සහ අනෙකුත්. TXT ලෙස ප්රතිදානය, SRT, VTT, DOCX, JSON, හෝ PDF.
ඔව්. කථානායක diarization සමගින් ධාවනය SenseVoice සෑම පරිවර්තනය සඳහා - එක් එක් කථානායක ලේබල් කර ඇති අතර ඔබ පසුව සංස්කාරක ඔවුන්ට නැවත නම් කළ හැකිය.
ඔව්. SenseVoice අපගේ කළමනාකරණය කරන ලද පරිසරයේ ධාවනය වේ - ශ්රව්ය පෙරනිමියෙන් සකස් කර මකා දමා කිසි විටෙකත් පැහැදිලිව තෝරා නොගත් පුහුණුව සඳහා භාවිතා නොකරයි. ප් රො සැලසුම් විවේකයේ දී පරිවර්තන සඳහා සේවාදායක පැත්තේ ගුප්ත කේතනය එකතු කරයි.
එම ශ්රව්ය මත වෙනත් සහාය ආකෘතිය එරෙහිව ධාවනය කිරීමට සසඳන්න-stt මෙවලම භාවිතා කරන්න SenseVoice - ඔබ WER දකින්න, කොටස ගණන්, කථානායක ලේබල්, සහ විශ්වාසය පැත්තෙන් පැත්තට ලකුණු. මෙම SenseVoice විස්පර් විශාල V3 සංසන්දනය වඩාත් පොදු ධාවනය වේ.
ඔව්. / v1 / transcribe අවසාන ස්ථානය මත ආකෘති පරාමිතියක් ලෙස "sensevoice" සඳහන් කරන්න. Python සහ Node.js SDKs SenseVoice උදාහරණ ඇතුළත් වේ. නොමිලේ API තට්ටුව 100 විනාඩි / මාසයක් ඇතුළත් වේ.
ඔව්. SenseVoice MIT බලපත්ර ලත් නිසා, ඔබට එය ස්වයං-සත්කාරකත්වය දැක්විය හැකිය. STT.ai හි විවෘත මූලාශ්රය පිටුව ව්යාපෘතිය සහ බර ලැයිස්තුගත කරයි. බොහෝ නිෂ්පාදන කණ්ඩායම් GPU මිලදී ගැනීම, ආකෘති හුවමාරු කිරීම සහ මෙහෙයුම් අතහැර දැමීමට අපගේ සත්කාරක අනුවාදය භාවිතා කරයි.