સાથે લખો SenseVoice

Name: SenseVoice
Author: FunAudioLLM

જાહેર ઉપલબ્ધ ઓડિયો અને વિડિયો સાથે કામ કરે છે. DRM-સુરક્ષિત સમાવિષ્ટો આધારભૂત નથી.

વધારા માટે સુધારો

ખાનગી ટ્રાન્સક્રિપ્ટ

ટ્રાન્સક્રિપ્ટ સાથે વાતચીત કરો

Pro સાથે તાળુ ખોલો →

ફાઇલ અહીં મૂકો અથવા બ્રાઉઝ કરવા માટે ક્લિક કરો

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — ૨GB સુધી

બહુવિધ ફાઇલોને બેચ અપલોડ કરો પ્રો સાથે

વધારા માટે સુધારો

ખાનગી ટ્રાન્સક્રિપ્ટ

ટ્રાન્સક્રિપ્ટ સાથે વાતચીત કરો

Pro સાથે તાળુ ખોલો →

વધારા માટે સુધારો

લખાણમાં વાસ્તવિક સમયની બોલી. AI આપોઆપ-સમાધાન કરે છે જેમ તમે બોલો છો - લાંબી બોલી સાથે ચોકસાઈ સુધરે છે.

તમારું માઇક્રોફોન પહેલેથી ચકાસો

૧૦ મુક્ત મિનિટ/દિવસ નોંધણી સાથે 600 મિનિટ મુક્ત ક્રેડિટ કાર્ડ નથી એનક્રિપ્ટ થયેલ

મફત નોંધણી કરો →

5.5%

WER

ભાષાઓ

50.0x

ઝડપ

MIT

લાઇસન્સ

વિશે SenseVoice

SenseVoice એ FunAudioLLM માંથી ભાષા ફાઉન્ડેશન મોડેલ છે કે જે અનુવાદથી આગળ જાય છે. તે 50+ ભાષાઓને આધાર આપે છે અને એક મોડેલમાં લાગણી ઓળખવા, ઓડિયો ઘટના શોધવા, અને ઉલટા લખાણ સામાન્યીકરણ માટે ક્ષમતાઓ સમાવે છે.

આના દ્વારા આધારિત ભાષાઓ SenseVoice

અંગ્રેજી

સ્પેનિશ

ફ્રેન્ચ

જર્મન

ચાઇનીઝ

જાપાનીઝ

કોરિયન

પોર્ટુગીઝ

અરબી

હિન્દી

રશિયન

ઇટાલિયન

ડચ

ટર્કિશ

પોલીશ

સ્વીડિશ

ઇન્ડોનેશિયન

થાઈ

વિયેતનામીસ

ચેક

ગ્રીક

રોમાનિયન

હંગેરિયન

હીબ્રુ

ડેનિશ

ફિનિશ

નૉર્વેજીયન

યુક્રેનિયન

મલય

બાંગ્લા

મોડેલ જાણકારી

પૂરૂં પાડનારFunAudioLLM
આર્કિટેક્ચર-
લાઇસન્સMIT
સુધારેલMar 2026

સંબંધિત મોડેલો

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

વારંવાર પૂછાતા પ્રશ્નો

SenseVoice એ FunAudioLLM દ્દારા બોલી-થી-લખાણ મોડેલ છે. STT.ai એ અમારા GPU ઇન્ફ્રાસ્ટ્રક્ચર પર SenseVoice ને યજમાન બનાવે છે જેથી તમે તમારા પોતાના હાર્ડવેર પૂરુ પાડ્યા વિના તેને વાપરી શકો - ઓડિયો અથવા વિડિયો અપલોડ કરો અને મોડેલ પસંદ કરનારમાંથી SenseVoice ને પસંદ કરો.

પ્રમાણભૂત બેન્ચમાર્ક પર, SenseVoice એ 5.5% શબ્દ ભૂલ દરને આસપાસ મેળવે છે. વાસ્તવિક-વિશ્વની ચોકસાઈ ઓડિયો ગુણવત્તા, ઉચ્ચારણ અને ભાષા પર આધારિત છે; ધુમાડાવાળા અથવા ઉચ્ચારણવાળા રેકોર્ડિંગ માટે, થોડા ટકા પોઇન્ટ્સ ઊંચા WER ની અપેક્ષા રાખો.

SenseVoice STT.ai ની મુક્ત સ્તર પર ચલાવે છે - દરેક મુલાકાતીને કોઈ ખર્ચ વગર શરૂ કરવા માટે 600 મિનિટ મળે છે. ચૂકવેલ યોજનાઓ ફાઇલ પ્રતિ લાંબી મર્યાદાઓ, ખાનગી ટ્રાન્સક્રિપ્ટ્સ, અને પ્રાથમિકતા કતાર ઉમેરવા માટે.

SenseVoice MIT ની નીચે બહાર પાડવામાં આવે છે, એક પરવાનગી આપતી ઓપન-સોર્સ લાઇસન્સ. તમે તમારા પોતાના હાર્ડવેરમાં SenseVoice ને સ્વયં-હોસ્ટ કરી શકો છો અથવા અમારી હોસ્ટ કરેલ આવૃત્તિનો ઉપયોગ કરી શકો છો - બંને વાણિજ્યિક રીતે ઉપયોગી છે.

SenseVoice 50 ભાષાઓને આધાર આપે છે. આપમેળે-શોધ એ મોટાભાગના ઓડિયો માટે સાચી ભાષા પસંદ કરે છે; તમે તેને નાની ચોકસાઈ માટે જાતે પણ સ્પષ્ટ કરી શકો છો.

SenseVoice ઓડિયો પ્રક્રિયાઓ અમારા GPUs પર 50.0x વાસ્તવિક સમય પર. 1-કલાકની ઓડિયો ફાઈલ 1 મિનિટમાં સમાપ્ત થાય છે; લાંબી ફાઈલો કતારમાં અને જ્યારે પૂર્ણ થાય ત્યારે ઈમેઈલ દ્વારા સૂચિત કરે છે.

SenseVoice પાસે 234M પરિમાણો છે. મોટા મોડેલો વધુ ચોક્કસ હોય છે પરંતુ ધીમા; STT.ai GPU પર SenseVoice યજમાન છે તેથી પરિમાણ ગણતરી તમારી ક્લાયન્ટ-સાઇડ કાર્યક્ષમતા અસર કરતી નથી.

SenseVoice દરેક બંધારણને સ્વીકારે છે કે જે STT.ai આધાર આપે છે — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, અને અન્ય. આઉટપુટ TXT, SRT, VTT, DOCX, JSON, અથવા PDF તરીકે.

હા. સ્પીકર ડેટાબેઝ દરેક અનુવાદ માટે SenseVoice ની સાથે ચાલે છે - દરેક સ્પીકર ને લેબલ કરેલ છે અને તમે પછી સંપાદકમાં તેનું નામ બદલી શકો છો.

હા. SenseVoice અમારા સંચાલિત વાતાવરણમાં ચાલે છે - ઓડિયો મૂળભૂત રીતે પ્રક્રિયા કરેલ છે અને કાઢી નાખવામાં આવે છે અને સ્પષ્ટ રીતે પસંદગી કર્યા વિના તાલીમ માટે ક્યારેય વપરાય નહિં. પ્રો યોજનાઓ અસ્થિર ટ્રાન્સક્રિપ્ટ્સ માટે ક્લાયન્ટ-સાઇડ એનક્રિપ્શન ઉમેરે છે.

SenseVoice ને કોઈપણ અન્ય આધારભૂત મોડેલ સામે એ જ ઓડિયો પર ચલાવવા માટે સરખામણી-stt સાધનનો ઉપયોગ કરો - તમે WER, સેગમેન્ટ ગણતરી, સ્પીકર લેબલ્સ, અને વિશ્વાસ સ્કોર બાજુ-બે-બાજુ જોશો. SenseVoice વિ Whisper Large V3 સરખામણી સૌથી સામાન્ય રીતે ચલાવે છે.

હા. /v1/transcribe અંતિમબિંદુ પર મોડેલ પરિમાણ તરીકે "sensevoice" ને સ્પષ્ટ કરો. Python અને Node.js SDKs SenseVoice ઉદાહરણો સમાવે છે. મુક્ત API સ્તરમાં 100 મિનિટ/મહિના સમાવે છે.

હા. કારણ કે SenseVoice એ MIT-લાઇસન્સ થયેલ છે, તમે તેને સ્વયં-હોસ્ટ કરી શકો છો. STT.ai નું ઓપન-સોર્સ પાનું પ્રોજેક્ટ રેપો અને વજનોની યાદી કરે છે. મોટાભાગના ઉત્પાદન ટીમો GPU ખરીદી, મોડેલ સ્વેપ અને ઓપસને છોડવા માટે અમારી યજમાન આવૃત્તિ વાપરે છે.

સાથે લખો SenseVoice

વિશે SenseVoice

આના દ્વારા આધારિત ભાષાઓ SenseVoice

મોડેલ જાણકારી

સંબંધિત મોડેલો

વારંવાર પૂછાતા પ્રશ્નો

SenseVoice શું છે?

SenseVoice કેટલું ચોક્કસ છે?

શું SenseVoice વાપરવા માટે મુક્ત છે?

SenseVoice કઈ લાઇસન્સ વાપરે છે?

કેટલી ભાષાઓ SenseVoice આધાર આપે છે?

SenseVoice કેટલું ઝડપી છે?

SenseVoice મોડેલ કેટલું મોટું છે?

કયા ઓડિયો બંધારણો SenseVoice રૂપાંતરિત કરી શકે છે?

શું SenseVoice ઘણાબધા સ્પીકર શોધે છે?

શું મારી માહિતી ખાનગી છે જ્યારે SenseVoice વાપરી રહ્યા હોય?

SenseVoice અન્ય STT મોડેલોની સરખામણીમાં કેવી રીતે છે?

શું હું API મારફતે SenseVoice વાપરી શકું?

શું હું મારા પોતાના સર્વર પર SenseVoice ચલાવી શકું?