کے ساتھ ٹرانسکرائب Vosk
12.0%
WER
20
Languages
100.0x
Speed
Apache 2.0
License
کے بارے میں Vosk
Vosk is an offline speech recognition toolkit that works without an internet connection. It supports 20+ languages with compact models that can run on mobile devices, Raspberry Pi, and any platform. Built on Kaldi and Zipformer architectures.
معاونت یافتہ زبانیں Vosk
Model Info
- ProviderAlpha Cephei
- Architecture-
- LicenseApache 2.0
- UpdatedMar 2026
عام سوالات
Vosk Alpha Cepheiکے ذريعے Voskکا Alpha Cepheiکے ذريعے Alpha Cepheiکا Voskکا Voskکا STT.aiہوسٹ کر تا هے تاکہ آپ اسے استعمال کر سکيں بغير آپکے خود کے ہارڈ و يرڈ کے آپلوڈ کر نے کے آڊيو يا ويڈیو اور ماڈل منتخب کر نے والے سے Voskکو منتخب کر نے کے
معیاری معیاروں پر، Vosk 12.0% ورڈ ایرر ریٹ حاصل کرتا ہے. حقیقی دنیا میں دقت آڈیو کی کیفیت، لہجہ اور زبان پر منحصر ہے؛ شوردار یا لہجہ والی ریکارڈنگ کے لیے، چند فیصد پوائنٹوں کی توقع کریں WER زیادہ.
Vosk STT.ai کے مفت سطح پر چلتا ہے - ہر مہمان کو 600 منٹ / ماہ کوئی خرچ نہیں ہوتا. ادا کردہ منصوبے پر فائیل زیادہ حدیں، نجی نقل، اور ترجیح کی قطار لگاتے ہیں.
Vosk کو Apache 2.0 کے تحت آزاد کیا گیا ہے، ایک اجازت دار اوپن سورس لائسنس. آپ اپنے ہیڈریڈر پر خود-ہسٹ Vosk استعمال کرسکتے ہیں یا ہماری مہمانداری ورژن استعمال کرسکتے ہیں - دونوں تجارتی طور پر استعمال کی جاسکتے ہیں.
Vosk 20 زبانوں کو مدد دیتا ہے. خودکار دریافت زیادہ تر آڈیوز کے لیے صحیح زبان کو منتخب کرتا ہے؛ آپ اسے چھوٹے صحیح لیفت کے لیے ہاتھ سے بھی بیان کرسکتے ہیں.
Vosk ہمارے GPUs پر 100.0x ریئل ٹائم پر آڈیو پروسیسنگ کرتا ہے. ایک 1 گھنٹہ آڈیو فائل 1 منٹ میں ختم ہوتی ہے؛ لمبی فائل کی قطار اور جب ختم ہو جائے تو ای میل کے ذریعے اطلاع دی جائے گی.
Vosk ميں 50M پارا مڈل هے. بڑ ماڈل زیادہ صحيح هے مگر سست هے STT.ai GPU پر Vosk ميزبان هے اس ليے پارا مڈل شماري آپکے کلائنٹ سا يد پرفارمنس کو متاثر نہیں کر تا
Vosk ہر فارمیٹ قبول کرتا ہے جو STT.ai حمایت کرتا ہے - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, اور باقی. TXT, SRT, VTT, DOCX, JSON, or PDF کے طور پر خروجی.
ہاں۔ ہر نقل کے لئے Vosk کے ساتھ ساتھ اسپیکر ڈائریزیشن چلتا ہے۔ ہر اسپیکر کو لیبل دیا جاتا ہے اور آپ بعد میں ایڈیٹر میں ان کا نام بدل سکتے ہیں۔
ہاں. Vosk ہمارے انتظامی ماحول میں چلتا ہے - آڈیو کو پروسیسنگ اور ڈیفالٹ کے طور پر حذف کیا جاتا ہے اور واضح آپٹ-ان کے بغیر تربیت کے لئے کبھی استعمال نہیں کیا جاتا. پرو منصوبے آرام میں نقل کے لئے کلائنٹ-سایڈ انکریفٹنگ شامل کرتے ہیں.
Vosk کو ایک ہی آڈیو پر کسی بھی دوسرے مدد شدہ ماڈل کے خلاف چلانے کے لیے comparison-stt ٹول استعمال کریں - آپ WER، سگمنٹ گنتی، اسپیکر لیبلز، اور اعتماد کے سکور دیکھیں گے. Vosk vs Whisper Large V3 موازنہ سب سے عام چلتا ہے.
جی ہاں. /v1/transcribe انتہا پوائنٹ پر ماڈل پیرامیٹر کے طور پر "vosk" کو بیان کریں. Python اور Node.js SDKs میں Vosk مثالیں شامل ہیں. مفت API سطح میں 100 منٹ/مہینت شامل ہیں.
جی ہاں. کیونکہ Vosk Apache 2.0 لائسنس ہے، آپ اسے خود مہمان بنا سکتے ہیں. STT.ai کے اوپن سورس صفحے پر پروجیکٹ ریپو اور وزن کی فہرست ہے. زیادہ تر پروڈکشن ٹیم GPU کی فراہمی کو چھوڑنے کے ليے ہمارے مہمانہ ورژن کا استعمال کرتے هے، ماڈل سواپ اور آپس.