Transcribe with Vosk
12.0%
WER
20
Languages
100.0x
Speed
Apache 2.0
License
About Vosk
Languages Supported by Vosk
Model Info
- ProviderAlpha Cephei
- Architecture-
- LicenseApache 2.0
- UpdatedMar 2026
گھڻا پڇيل سوال
Vosk Alpha Cephei جو ڳالهائڻ-لکڻ ماڊل آھي. STT.ai Vosk کي اسان جي GPU جي بنياد تي ميزبان ڪري ٿو تنھنڪري توھان ان کي پنھنجي هارڊويئر جي فراهمي کانسواءِ استعمال ڪري سگھو ٿا - آڊيو يا وڊيو اپ لوڊ ڪريو ۽ ماڊل چونڊيندڙ مان Vosk چونڊيو.
معياري معيار تي، Vosk 12.0% لفظ غلطي جي شرح حاصل ڪري ٿو. حقيقي دنيا جي دقت آڊيو جي معيار، ڌيان ۽ ٻولي تي منحصر آهي؛ شور يا ڌيان رکندڙ رڪارڊنگ لاءِ، ڪجهه سيڪڙو پوائنٽس وڌيڪ WER جو اميد آهي.
Vosk STT.ai جي مفت سطح تي هلندو آهي - هر مهمان 600 منٽ / مهيني ۾ ڪابه رقم نه ٿي. ادا ڪيل منصوبا ڊگهي وقت تائين فائلن جي حدن، ذاتي نقلن ۽ ترجيح جي قطار ۾ شامل ڪن ٿا.
Vosk Apache 2.0 تحت جاري ڪيو ويو آهي، هڪ آزاد-سرو لاڳاپو لائسنس. توهان Vosk کي پنهنجي هارڊويئر تي پاڻمرادو ميزبان ڪري سگهو ٿا يا اسان جي ميزبان ورزن کي استعمال ڪري سگهو ٿا - ٻئي تجارتي طور استعمال ڪري سگهجن ٿا.
Vosk 20 ٻوليون سپورٽ ڪري ٿو. خودڪار ڳولا گھڻن آڊيو لاءِ صحيح ٻولي چونڊيندي آهي؛ توهان ان کي پاڻمرادو به بيان ڪري سگهو ٿا ته جيئن صحيحي ۾ ٿورو اضافو ٿئي.
Vosk اسان جي GPUs تي تقريبن 100.0x ريئل ٽائيم تي آڊيو پروسيس ڪري ٿو. 1 ڪلاڪ جي آڊيو فائل 1 منٽن ۾ ختم ٿئي ٿي؛ ڊگهيون فائل ڪنڊي ۾ رکجن ۽ جڏهن مڪمل ٿئي ته اي ميل ذريعي اطلاع ڏين.
Vosk وٽ 50M ماڊل آھن. وڏا ماڊل وڌيڪ درست آھن پر سست آھن؛ STT.ai Vosk کي GPU تي ميزبان ڪري ٿو تنھنڪري ماڊل جي ڳاڻيٽي توھان جي ڪلائنٽ-سائڊ ڪارڪردگي تي اثر نه ٿا وجهن.
Vosk سڀ فارميٽ قبول ڪري ٿو STT.ai مدد — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, ۽ ٻيا. خروجي طور TXT, SRT, VTT, DOCX, JSON, يا PDF.
ها. هر هڪ نقل لاءِ Vosk سان گڏ ڳالهائيندڙ جي ڊياريزيشن هلندي آهي - هر هڪ ڳالهائيندڙ تي ٽيگ لڳل آهي ۽ توهان انهن جو نالو پوءِ ايڊيٽر ۾ تبديل ڪري سگهو ٿا.
ها. Vosk اسان جي انتظامي ماحول ۾ هلندو آهي - آڊيو پروسيس ڪيو ويندو آهي ۽ اڻ سڌي طرح حذف ڪيو ويندو آهي ۽ ڪڏهن به واضح طور تي داخل ٿيڻ کانسواءِ تربيت لاءِ استعمال نه ٿيندو آهي. پرو منصوبا وقف ٿيل ترڪيبن لاءِ ڪلائنٽ-سائڊ انڪرپشن شامل ڪندا آهن.
compare-stt ٽولز کي استعمال ڪريو Vosk کي ڪنهن به ٻئي مدد ڏنل ماڊل سان گڏ هڪ ئي آڊيو تي هلائڻ لاءِ - توهان WER، حصن جي ڳاڻيٽي، اسپيڪر جي ليڊس ۽ اعتماد جا نتيجا پاسي پاسي ڏسندا. Vosk vs Whisper Large V3 مقابلو سڀ کان عام هلندڙ آهي.
ھائو. /v1/transcribe endpoint تي ماڊل پيراميڊ طور "vosk" جو بيان ڪريو. Python ۽ Node.js SDKs ۾ Vosk جا مثال شامل آهن. مفت API ٽيئر ۾ 100 منٽ/مھينو شامل آهن.
ها. ڇاڪاڻ ته Vosk Apache 2.0-ليزنٽ آهي، توهان ان کي پاڻمرادو ميزبان ڪري سگهو ٿا. STT.ai جي اوپن سورس صفحي ۾ منصوبي جي ريپو ۽ وزن جي فهرست آهي. گھڻيون پيداوار جون ٽيمون اسان جي ميزبان ورزن کي GPU جي خريداري، ماڊل سوئپس ۽ آپشن کي ڇڏڻ لاءِ استعمال ڪن ٿيون.