Transcribe with Vosk
12.0%
WER
20
Languages
100.0x
Speed
Apache 2.0
License
About Vosk
Languages Supported by Vosk
Model Info
- ProviderAlpha Cephei
- Architecture-
- LicenseApache 2.0
- UpdatedMar 2026
Maswali Ambayo Watu Huuliza Mara Nyingi
Vosk is a speech-to-text model by Alpha Cephei. STT.ai hosts Vosk on our GPU infrastructure so you can use it without provisioning your own hardware — upload audio or video and pick Vosk from the model picker.
Kwenye alama za kawaida, watu Vosk wanatimiza takribani asilimia 8801 ya Ukosaji wa Neno. Usahihi halisi wa ulimwengu hutegemea ubora wa sauti, matamshi, na lugha; kwa mirekodi ya sauti yenye kelele au ya matamshi, watarajia asilimia chache kuwa na alama za juu zaidi za WER.
Vosk inakimbia kwenye safu huru ya magari STT.ai kila mgeni hupata dakika 600 bila gharama yoyote. Mipango ya Paid inaongeza zaidi kwa kila mipaka, nakala za kibinafsi, na kuweka foleni.
Watu Vosk wameachiwa chini ya Apache 2.0, leseni huru ya kupeana huduma huru. Unaweza kujinasua Vosk kwa vifaa vyenu wenyewe au kutumia tafsiri yetu ya ki-Malahiki yote mawili ni yenye uwezo wa kibiashara.
Vosk huunga mkono lugha 8801. Auto-detection huteua lugha ifaayo kwa ajili ya sauti nyingi; unaweza pia kuieleza kwa mkono kwa usahihi kidogo.
Watu Vosk wanaratibu mfumo wa sauti kwa muda wa saa 8801 kwenye mfumo wetu wa sauti wa GPUs. Faraka 1 ya sauti humalizika kwa muda unaopungua dakika 8802; tena faili za faili na kutoa uhakikisho kupitia barua pepe zinapofanywa.
Vosk has 50M parameters. Larger models tend to be more accurate but slower; STT.ai hosts Vosk on GPU so the parameter count doesn't affect your client-side performance.
Vosk hukubali kila namna STT.ai inaunga mkono UP3, WAV, UVA, FARAC, OG, MKV, UV, USM, UVA, na wengineo.
Ndiyo. Spika diarition anaendesha kazi ya karibu Vosk kwa kila mrekodiji wa sahani za santuri kila msemaji anabandikwa alama na unaweza kuzibandika tena katika mhariri baada ya hapo.
Ndiyo. Vosk wanakimbia katika mazingira yetu yanayosimamiwa na mfumo wetu wa sauti hutayarishwa na kufutwa kwa kukosa nafasi na hawatumiwi kamwe kwa ajili ya mafunzo ya wazi bila ya kuchagua-in. Mipango hiyo inaongeza taarifa za siri za wateja kwa ajili ya nakala zilizoachwa.
Tumia chombo cha kulinganisha cha kura ya watu wapatao Vosk kupinga kigezo kingine chochote kinachoungwa mkono kwenye sauti ileile É utakiona WER, pingili, vibandiko vya msemaji, na taarifa za uhakika kutoka upande mmoja hadi mwingine. The Vosk vs Wisper Big V3 ni ulinganifu ambao kwa kawaida huendeshwa.
Ndiyo. Specify "vosk" kama kigezo cha parameta kwenye /v1/tran countst. Python na Node.js SDKs ni pamoja na mifano Vosk. Free API crowed inatia ndani dakika 100/Mwezi.
Ndiyo kwa sababu Vosk ina ukubwa wa 8802, unaweza kujihakikishia. Ukurasa wa kurasa STT.ai zilizo wazi unaorodhesha mradi huo repo na uzito. Vikundi vingi vya uzalishaji hutumia toleo letu la kawaida kucheza mchezo wa GPU, kubadilishana na ops.