کے ساتھ ٹرانسکرائب Vosk

عوامی طور پر دستیاب آڈیو اور ویڈیو کے ساتھ کام کرتا ہے. DRM-محفوظ مواد کو مدد نہیں دی جاتی.

بہتری کے لیے اپگریڈ
Private transcript
نقل کے ساتھ گفتگو کریں
پرو کے ساتھ تالک کھولیں →
فائلیں یہاں ڈالیں یا براؤز کرنے کے لیے کلک کریں
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM - 2GB تک
بہتری کے لیے اپگریڈ
Private transcript
نقل کے ساتھ گفتگو کریں
پرو کے ساتھ تالک کھولیں →
بہتری کے لیے اپگریڈ
ریکارڈنگ: 0:00
رئیل ٹائم موشی (حالی)
بہتر چپکے سے (صحيح)
عوامی رابطے: 24h، صرف متن · رجسٹر کریں 7d + آڈیو کے لیے · پرو نجی لنکس کے لیے

رئل ٹائم اسپیکینگ سے ٹیکسٹ. AI خودکار طور پر درست کرتا ہے جیسے آپ بولتے ہیں - صحیح بات بولنے سے بہتر ہوتا ہے

پہلے اپنا مائیکرو فون جانچیں
❤️ STT.ai سے محبت؟ اپنے دوستوں کو بتاؤ!
آپ نے اپنے مفت نقل استعمال کر رہے ہیں

600 منٹ / ماہ حاصل کرنے کے لئے مفت میں رجسٹر کریں، یا لامحدود نقل کے لئے اپگریڈ کریں.

10 مفت منٹ/دن 600 منٹ مفت میں رجسٹر کوئی کریڈٹ کارڈ نہیں خفیہ
مفت میں رجسٹر کریں →
12.0%
WER
20
Languages
100.0x
Speed
Apache 2.0
License

کے بارے میں Vosk

Vosk is an offline speech recognition toolkit that works without an internet connection. It supports 20+ languages with compact models that can run on mobile devices, Raspberry Pi, and any platform. Built on Kaldi and Zipformer architectures.

عام سوالات

Vosk Alpha Cepheiکے ذريعے Voskکا Alpha Cepheiکے ذريعے Alpha Cepheiکا Voskکا Voskکا STT.aiہوسٹ کر تا هے تاکہ آپ اسے استعمال کر سکيں بغير آپکے خود کے ہارڈ و يرڈ کے آپلوڈ کر نے کے آڊيو يا ويڈیو اور ماڈل منتخب کر نے والے سے Voskکو منتخب کر نے کے

معیاری معیاروں پر، Vosk 12.0% ورڈ ایرر ریٹ حاصل کرتا ہے. حقیقی دنیا میں دقت آڈیو کی کیفیت، لہجہ اور زبان پر منحصر ہے؛ شوردار یا لہجہ والی ریکارڈنگ کے لیے، چند فیصد پوائنٹوں کی توقع کریں WER زیادہ.

Vosk STT.ai کے مفت سطح پر چلتا ہے - ہر مہمان کو 600 منٹ / ماہ کوئی خرچ نہیں ہوتا. ادا کردہ منصوبے پر فائیل زیادہ حدیں، نجی نقل، اور ترجیح کی قطار لگاتے ہیں.

Vosk کو Apache 2.0 کے تحت آزاد کیا گیا ہے، ایک اجازت دار اوپن سورس لائسنس. آپ اپنے ہیڈریڈر پر خود-ہسٹ Vosk استعمال کرسکتے ہیں یا ہماری مہمانداری ورژن استعمال کرسکتے ہیں - دونوں تجارتی طور پر استعمال کی جاسکتے ہیں.

Vosk 20 زبانوں کو مدد دیتا ہے. خودکار دریافت زیادہ تر آڈیوز کے لیے صحیح زبان کو منتخب کرتا ہے؛ آپ اسے چھوٹے صحیح لیفت کے لیے ہاتھ سے بھی بیان کرسکتے ہیں.

Vosk ہمارے GPUs پر 100.0x ریئل ٹائم پر آڈیو پروسیسنگ کرتا ہے. ایک 1 گھنٹہ آڈیو فائل 1 منٹ میں ختم ہوتی ہے؛ لمبی فائل کی قطار اور جب ختم ہو جائے تو ای میل کے ذریعے اطلاع دی جائے گی.

Vosk ميں 50M پارا مڈل هے. بڑ ماڈل زیادہ صحيح هے مگر سست هے STT.ai GPU پر Vosk ميزبان هے اس ليے پارا مڈل شماري آپکے کلائنٹ سا يد پرفارمنس کو متاثر نہیں کر تا

Vosk ہر فارمیٹ قبول کرتا ہے جو STT.ai حمایت کرتا ہے - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, اور باقی. TXT, SRT, VTT, DOCX, JSON, or PDF کے طور پر خروجی.

ہاں۔ ہر نقل کے لئے Vosk کے ساتھ ساتھ اسپیکر ڈائریزیشن چلتا ہے۔ ہر اسپیکر کو لیبل دیا جاتا ہے اور آپ بعد میں ایڈیٹر میں ان کا نام بدل سکتے ہیں۔

ہاں. Vosk ہمارے انتظامی ماحول میں چلتا ہے - آڈیو کو پروسیسنگ اور ڈیفالٹ کے طور پر حذف کیا جاتا ہے اور واضح آپٹ-ان کے بغیر تربیت کے لئے کبھی استعمال نہیں کیا جاتا. پرو منصوبے آرام میں نقل کے لئے کلائنٹ-سایڈ انکریفٹنگ شامل کرتے ہیں.

Vosk کو ایک ہی آڈیو پر کسی بھی دوسرے مدد شدہ ماڈل کے خلاف چلانے کے لیے comparison-stt ٹول استعمال کریں - آپ WER، سگمنٹ گنتی، اسپیکر لیبلز، اور اعتماد کے سکور دیکھیں گے. Vosk vs Whisper Large V3 موازنہ سب سے عام چلتا ہے.

جی ہاں. /v1/transcribe انتہا پوائنٹ پر ماڈل پیرامیٹر کے طور پر "vosk" کو بیان کریں. Python اور Node.js SDKs میں Vosk مثالیں شامل ہیں. مفت API سطح میں 100 منٹ/مہینت شامل ہیں.

جی ہاں. کیونکہ Vosk Apache 2.0 لائسنس ہے، آپ اسے خود مہمان بنا سکتے ہیں. STT.ai کے اوپن سورس صفحے پر پروجیکٹ ریپو اور وزن کی فہرست ہے. زیادہ تر پروڈکشن ٹیم GPU کی فراہمی کو چھوڑنے کے ليے ہمارے مہمانہ ورژن کا استعمال کرتے هے، ماڈل سواپ اور آپس.