સાથે લખો Vosk

Name: Vosk
Author: Alpha Cephei

જાહેર ઉપલબ્ધ ઓડિયો અને વિડિયો સાથે કામ કરે છે. DRM-સુરક્ષિત સમાવિષ્ટો આધારભૂત નથી.

વધારા માટે સુધારો

ખાનગી ટ્રાન્સક્રિપ્ટ

ટ્રાન્સક્રિપ્ટ સાથે વાતચીત કરો

Pro સાથે તાળુ ખોલો →

ફાઇલ અહીં મૂકો અથવા બ્રાઉઝ કરવા માટે ક્લિક કરો

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — ૨GB સુધી

બહુવિધ ફાઇલોને બેચ અપલોડ કરો પ્રો સાથે

વધારા માટે સુધારો

ખાનગી ટ્રાન્સક્રિપ્ટ

ટ્રાન્સક્રિપ્ટ સાથે વાતચીત કરો

Pro સાથે તાળુ ખોલો →

વધારા માટે સુધારો

લખાણમાં વાસ્તવિક સમયની બોલી. AI આપોઆપ-સમાધાન કરે છે જેમ તમે બોલો છો - લાંબી બોલી સાથે ચોકસાઈ સુધરે છે.

તમારું માઇક્રોફોન પહેલેથી ચકાસો

૧૦ મુક્ત મિનિટ/દિવસ નોંધણી સાથે 600 મિનિટ મુક્ત ક્રેડિટ કાર્ડ નથી એનક્રિપ્ટ થયેલ

મફત નોંધણી કરો →

12.0%

WER

ભાષાઓ

100.0x

ઝડપ

Apache 2.0

લાઇસન્સ

વિશે Vosk

Vosk એ ઓફલાઇન ભાષા ઓળખ સાધન છે કે જે ઇન્ટરનેટ જોડાણ વગર કામ કરે છે. તે 20+ ભાષાઓને કોમ્પેક્ટ મોડેલો સાથે આધાર આપે છે કે જે મોબાઇલ ઉપકરણો, Raspberry Pi, અને કોઈપણ પ્લેટફોર્મ પર ચલાવી શકે છે. Kaldi અને Zipformer આર્કિટેક્ચર પર બનાવેલ છે.

આના દ્વારા આધારિત ભાષાઓ Vosk

અંગ્રેજી

સ્પેનિશ

ફ્રેન્ચ

જર્મન

ચાઇનીઝ

જાપાનીઝ

કોરિયન

પોર્ટુગીઝ

અરબી

હિન્દી

રશિયન

ઇટાલિયન

ડચ

ટર્કિશ

પોલીશ

સ્વીડિશ

ઇન્ડોનેશિયન

વિયેતનામીસ

ચેક

ગ્રીક

મોડેલ જાણકારી

પૂરૂં પાડનારAlpha Cephei
આર્કિટેક્ચર-
લાઇસન્સApache 2.0
સુધારેલMar 2026

સંબંધિત મોડેલો

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

વારંવાર પૂછાતા પ્રશ્નો

Vosk એ Alpha Cephei દ્દારા બોલી-થી-લખાણ મોડેલ છે. STT.ai એ અમારા GPU ઇન્ફ્રાસ્ટ્રક્ચર પર Vosk ને યજમાન બનાવે છે જેથી તમે તમારા પોતાના હાર્ડવેર પૂરુ પાડ્યા વિના તેને વાપરી શકો - ઓડિયો અથવા વિડિયો અપલોડ કરો અને મોડેલ પસંદ કરનારમાંથી Vosk ને પસંદ કરો.

પ્રમાણભૂત બેન્ચમાર્ક પર, Vosk એ 12.0% શબ્દ ભૂલ દરને આસપાસ મેળવે છે. વાસ્તવિક-વિશ્વની ચોકસાઈ ઓડિયો ગુણવત્તા, ઉચ્ચારણ અને ભાષા પર આધારિત છે; ધુમાડાવાળા અથવા ઉચ્ચારણવાળા રેકોર્ડિંગ માટે, થોડા ટકા પોઇન્ટ્સ ઊંચા WER ની અપેક્ષા રાખો.

Vosk STT.ai ની મુક્ત સ્તર પર ચલાવે છે - દરેક મુલાકાતીને કોઈ ખર્ચ વગર શરૂ કરવા માટે 600 મિનિટ મળે છે. ચૂકવેલ યોજનાઓ ફાઇલ પ્રતિ લાંબી મર્યાદાઓ, ખાનગી ટ્રાન્સક્રિપ્ટ્સ, અને પ્રાથમિકતા કતાર ઉમેરવા માટે.

Vosk Apache 2.0 ની નીચે બહાર પાડવામાં આવે છે, એક પરવાનગી આપતી ઓપન-સોર્સ લાઇસન્સ. તમે તમારા પોતાના હાર્ડવેરમાં Vosk ને સ્વયં-હોસ્ટ કરી શકો છો અથવા અમારી હોસ્ટ કરેલ આવૃત્તિનો ઉપયોગ કરી શકો છો - બંને વાણિજ્યિક રીતે ઉપયોગી છે.

Vosk 20 ભાષાઓને આધાર આપે છે. આપમેળે-શોધ એ મોટાભાગના ઓડિયો માટે સાચી ભાષા પસંદ કરે છે; તમે તેને નાની ચોકસાઈ માટે જાતે પણ સ્પષ્ટ કરી શકો છો.

Vosk ઓડિયો પ્રક્રિયાઓ અમારા GPUs પર 100.0x વાસ્તવિક સમય પર. 1-કલાકની ઓડિયો ફાઈલ 1 મિનિટમાં સમાપ્ત થાય છે; લાંબી ફાઈલો કતારમાં અને જ્યારે પૂર્ણ થાય ત્યારે ઈમેઈલ દ્વારા સૂચિત કરે છે.

Vosk પાસે 50M પરિમાણો છે. મોટા મોડેલો વધુ ચોક્કસ હોય છે પરંતુ ધીમા; STT.ai GPU પર Vosk યજમાન છે તેથી પરિમાણ ગણતરી તમારી ક્લાયન્ટ-સાઇડ કાર્યક્ષમતા અસર કરતી નથી.

Vosk દરેક બંધારણને સ્વીકારે છે કે જે STT.ai આધાર આપે છે — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, અને અન્ય. આઉટપુટ TXT, SRT, VTT, DOCX, JSON, અથવા PDF તરીકે.

હા. સ્પીકર ડેટાબેઝ દરેક અનુવાદ માટે Vosk ની સાથે ચાલે છે - દરેક સ્પીકર ને લેબલ કરેલ છે અને તમે પછી સંપાદકમાં તેનું નામ બદલી શકો છો.

હા. Vosk અમારા સંચાલિત વાતાવરણમાં ચાલે છે - ઓડિયો મૂળભૂત રીતે પ્રક્રિયા કરેલ છે અને કાઢી નાખવામાં આવે છે અને સ્પષ્ટ રીતે પસંદગી કર્યા વિના તાલીમ માટે ક્યારેય વપરાય નહિં. પ્રો યોજનાઓ અસ્થિર ટ્રાન્સક્રિપ્ટ્સ માટે ક્લાયન્ટ-સાઇડ એનક્રિપ્શન ઉમેરે છે.

Vosk ને કોઈપણ અન્ય આધારભૂત મોડેલ સામે એ જ ઓડિયો પર ચલાવવા માટે સરખામણી-stt સાધનનો ઉપયોગ કરો - તમે WER, સેગમેન્ટ ગણતરી, સ્પીકર લેબલ્સ, અને વિશ્વાસ સ્કોર બાજુ-બે-બાજુ જોશો. Vosk વિ Whisper Large V3 સરખામણી સૌથી સામાન્ય રીતે ચલાવે છે.

હા. /v1/transcribe અંતિમબિંદુ પર મોડેલ પરિમાણ તરીકે "vosk" ને સ્પષ્ટ કરો. Python અને Node.js SDKs Vosk ઉદાહરણો સમાવે છે. મુક્ત API સ્તરમાં 100 મિનિટ/મહિના સમાવે છે.

હા. કારણ કે Vosk એ Apache 2.0-લાઇસન્સ થયેલ છે, તમે તેને સ્વયં-હોસ્ટ કરી શકો છો. STT.ai નું ઓપન-સોર્સ પાનું પ્રોજેક્ટ રેપો અને વજનોની યાદી કરે છે. મોટાભાગના ઉત્પાદન ટીમો GPU ખરીદી, મોડેલ સ્વેપ અને ઓપસને છોડવા માટે અમારી યજમાન આવૃત્તિ વાપરે છે.

સાથે લખો Vosk

વિશે Vosk

આના દ્વારા આધારિત ભાષાઓ Vosk

મોડેલ જાણકારી

સંબંધિત મોડેલો

વારંવાર પૂછાતા પ્રશ્નો

Vosk શું છે?

Vosk કેટલું ચોક્કસ છે?

શું Vosk વાપરવા માટે મુક્ત છે?

Vosk કઈ લાઇસન્સ વાપરે છે?

કેટલી ભાષાઓ Vosk આધાર આપે છે?

Vosk કેટલું ઝડપી છે?

Vosk મોડેલ કેટલું મોટું છે?

કયા ઓડિયો બંધારણો Vosk રૂપાંતરિત કરી શકે છે?

શું Vosk ઘણાબધા સ્પીકર શોધે છે?

શું મારી માહિતી ખાનગી છે જ્યારે Vosk વાપરી રહ્યા હોય?

Vosk અન્ય STT મોડેલોની સરખામણીમાં કેવી રીતે છે?

શું હું API મારફતે Vosk વાપરી શકું?

શું હું મારા પોતાના સર્વર પર Vosk ચલાવી શકું?