کے ساتھ ٹرانسکرائب Whisper Large V3
4.2%
WER
99
Languages
8.0x
Speed
MIT
License
کے بارے میں Whisper Large V3
Whisper Large V3 is OpenAI's flagship open-source speech recognition model. With 1.55 billion parameters, it offers exceptional accuracy across 99 languages. It uses a transformer encoder-decoder architecture trained on 680,000 hours of multilingual audio data.
Model Info
- ProviderOpenAI
- Architecture-
- LicenseMIT
- UpdatedMar 2026
عام سوالات
Whisper Large V3 OpenAIکے ذريعے Whisper Large V3کا OpenAIکے ذريعے OpenAIکا Whisper Large V3کا Whisper Large V3کا STT.aiہوسٹ کر تا هے تاکہ آپ اسے استعمال کر سکيں بغير آپکے خود کے ہارڈ و يرڈ کے آپلوڈ کر نے کے آڊيو يا ويڈیو اور ماڈل منتخب کر نے والے سے Whisper Large V3کو منتخب کر نے کے
معیاری معیاروں پر، Whisper Large V3 4.2% ورڈ ایرر ریٹ حاصل کرتا ہے. حقیقی دنیا میں دقت آڈیو کی کیفیت، لہجہ اور زبان پر منحصر ہے؛ شوردار یا لہجہ والی ریکارڈنگ کے لیے، چند فیصد پوائنٹوں کی توقع کریں WER زیادہ.
Whisper Large V3 STT.ai کے مفت سطح پر چلتا ہے - ہر مہمان کو 600 منٹ / ماہ کوئی خرچ نہیں ہوتا. ادا کردہ منصوبے پر فائیل زیادہ حدیں، نجی نقل، اور ترجیح کی قطار لگاتے ہیں.
Whisper Large V3 کو MIT کے تحت آزاد کیا گیا ہے، ایک اجازت دار اوپن سورس لائسنس. آپ اپنے ہیڈریڈر پر خود-ہسٹ Whisper Large V3 استعمال کرسکتے ہیں یا ہماری مہمانداری ورژن استعمال کرسکتے ہیں - دونوں تجارتی طور پر استعمال کی جاسکتے ہیں.
Whisper Large V3 99 زبانوں کو مدد دیتا ہے. خودکار دریافت زیادہ تر آڈیوز کے لیے صحیح زبان کو منتخب کرتا ہے؛ آپ اسے چھوٹے صحیح لیفت کے لیے ہاتھ سے بھی بیان کرسکتے ہیں.
Whisper Large V3 ہمارے GPUs پر 8.0x ریئل ٹائم پر آڈیو پروسیسنگ کرتا ہے. ایک 1 گھنٹہ آڈیو فائل 7 منٹ میں ختم ہوتی ہے؛ لمبی فائل کی قطار اور جب ختم ہو جائے تو ای میل کے ذریعے اطلاع دی جائے گی.
Whisper Large V3 ميں 1.55B پارا مڈل هے. بڑ ماڈل زیادہ صحيح هے مگر سست هے STT.ai GPU پر Whisper Large V3 ميزبان هے اس ليے پارا مڈل شماري آپکے کلائنٹ سا يد پرفارمنس کو متاثر نہیں کر تا
Whisper Large V3 ہر فارمیٹ قبول کرتا ہے جو STT.ai حمایت کرتا ہے - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, اور باقی. TXT, SRT, VTT, DOCX, JSON, or PDF کے طور پر خروجی.
ہاں۔ ہر نقل کے لئے Whisper Large V3 کے ساتھ ساتھ اسپیکر ڈائریزیشن چلتا ہے۔ ہر اسپیکر کو لیبل دیا جاتا ہے اور آپ بعد میں ایڈیٹر میں ان کا نام بدل سکتے ہیں۔
ہاں. Whisper Large V3 ہمارے انتظامی ماحول میں چلتا ہے - آڈیو کو پروسیسنگ اور ڈیفالٹ کے طور پر حذف کیا جاتا ہے اور واضح آپٹ-ان کے بغیر تربیت کے لئے کبھی استعمال نہیں کیا جاتا. پرو منصوبے آرام میں نقل کے لئے کلائنٹ-سایڈ انکریفٹنگ شامل کرتے ہیں.
Whisper Large V3 کو ایک ہی آڈیو پر کسی بھی دوسرے مدد شدہ ماڈل کے خلاف چلانے کے لیے comparison-stt ٹول استعمال کریں - آپ WER، سگمنٹ گنتی، اسپیکر لیبلز، اور اعتماد کے سکور دیکھیں گے. Whisper Large V3 vs Whisper Large V3 موازنہ سب سے عام چلتا ہے.
جی ہاں. /v1/transcribe انتہا پوائنٹ پر ماڈل پیرامیٹر کے طور پر "whisper-large-v3" کو بیان کریں. Python اور Node.js SDKs میں Whisper Large V3 مثالیں شامل ہیں. مفت API سطح میں 100 منٹ/مہینت شامل ہیں.
جی ہاں. کیونکہ Whisper Large V3 MIT لائسنس ہے، آپ اسے خود مہمان بنا سکتے ہیں. STT.ai کے اوپن سورس صفحے پر پروجیکٹ ریپو اور وزن کی فہرست ہے. زیادہ تر پروڈکشن ٹیم GPU کی فراہمی کو چھوڑنے کے ليے ہمارے مہمانہ ورژن کا استعمال کرتے هے، ماڈل سواپ اور آپس.