Transcribe with Distil-Whisper
5.8%
WER
99
Languages
48.0x
Speed
MIT
License
About Distil-Whisper
Model Info
- ProviderHugging Face
- Architecture-
- LicenseMIT
- UpdatedMar 2026
گھڻا پڇيل سوال
Distil-Whisper Hugging Face جو ڳالهائڻ-لکڻ ماڊل آھي. STT.ai Distil-Whisper کي اسان جي GPU جي بنياد تي ميزبان ڪري ٿو تنھنڪري توھان ان کي پنھنجي هارڊويئر جي فراهمي کانسواءِ استعمال ڪري سگھو ٿا - آڊيو يا وڊيو اپ لوڊ ڪريو ۽ ماڊل چونڊيندڙ مان Distil-Whisper چونڊيو.
معياري معيار تي، Distil-Whisper 5.8% لفظ غلطي جي شرح حاصل ڪري ٿو. حقيقي دنيا جي دقت آڊيو جي معيار، ڌيان ۽ ٻولي تي منحصر آهي؛ شور يا ڌيان رکندڙ رڪارڊنگ لاءِ، ڪجهه سيڪڙو پوائنٽس وڌيڪ WER جو اميد آهي.
Distil-Whisper STT.ai جي مفت سطح تي هلندو آهي - هر مهمان 600 منٽ / مهيني ۾ ڪابه رقم نه ٿي. ادا ڪيل منصوبا ڊگهي وقت تائين فائلن جي حدن، ذاتي نقلن ۽ ترجيح جي قطار ۾ شامل ڪن ٿا.
Distil-Whisper MIT تحت جاري ڪيو ويو آهي، هڪ آزاد-سرو لاڳاپو لائسنس. توهان Distil-Whisper کي پنهنجي هارڊويئر تي پاڻمرادو ميزبان ڪري سگهو ٿا يا اسان جي ميزبان ورزن کي استعمال ڪري سگهو ٿا - ٻئي تجارتي طور استعمال ڪري سگهجن ٿا.
Distil-Whisper 99 ٻوليون سپورٽ ڪري ٿو. خودڪار ڳولا گھڻن آڊيو لاءِ صحيح ٻولي چونڊيندي آهي؛ توهان ان کي پاڻمرادو به بيان ڪري سگهو ٿا ته جيئن صحيحي ۾ ٿورو اضافو ٿئي.
Distil-Whisper اسان جي GPUs تي تقريبن 48.0x ريئل ٽائيم تي آڊيو پروسيس ڪري ٿو. 1 ڪلاڪ جي آڊيو فائل 1 منٽن ۾ ختم ٿئي ٿي؛ ڊگهيون فائل ڪنڊي ۾ رکجن ۽ جڏهن مڪمل ٿئي ته اي ميل ذريعي اطلاع ڏين.
Distil-Whisper وٽ 756M ماڊل آھن. وڏا ماڊل وڌيڪ درست آھن پر سست آھن؛ STT.ai Distil-Whisper کي GPU تي ميزبان ڪري ٿو تنھنڪري ماڊل جي ڳاڻيٽي توھان جي ڪلائنٽ-سائڊ ڪارڪردگي تي اثر نه ٿا وجهن.
Distil-Whisper سڀ فارميٽ قبول ڪري ٿو STT.ai مدد — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, ۽ ٻيا. خروجي طور TXT, SRT, VTT, DOCX, JSON, يا PDF.
ها. هر هڪ نقل لاءِ Distil-Whisper سان گڏ ڳالهائيندڙ جي ڊياريزيشن هلندي آهي - هر هڪ ڳالهائيندڙ تي ٽيگ لڳل آهي ۽ توهان انهن جو نالو پوءِ ايڊيٽر ۾ تبديل ڪري سگهو ٿا.
ها. Distil-Whisper اسان جي انتظامي ماحول ۾ هلندو آهي - آڊيو پروسيس ڪيو ويندو آهي ۽ اڻ سڌي طرح حذف ڪيو ويندو آهي ۽ ڪڏهن به واضح طور تي داخل ٿيڻ کانسواءِ تربيت لاءِ استعمال نه ٿيندو آهي. پرو منصوبا وقف ٿيل ترڪيبن لاءِ ڪلائنٽ-سائڊ انڪرپشن شامل ڪندا آهن.
compare-stt ٽولز کي استعمال ڪريو Distil-Whisper کي ڪنهن به ٻئي مدد ڏنل ماڊل سان گڏ هڪ ئي آڊيو تي هلائڻ لاءِ - توهان WER، حصن جي ڳاڻيٽي، اسپيڪر جي ليڊس ۽ اعتماد جا نتيجا پاسي پاسي ڏسندا. Distil-Whisper vs Whisper Large V3 مقابلو سڀ کان عام هلندڙ آهي.
ھائو. /v1/transcribe endpoint تي ماڊل پيراميڊ طور "distil-whisper" جو بيان ڪريو. Python ۽ Node.js SDKs ۾ Distil-Whisper جا مثال شامل آهن. مفت API ٽيئر ۾ 100 منٽ/مھينو شامل آهن.
ها. ڇاڪاڻ ته Distil-Whisper MIT-ليزنٽ آهي، توهان ان کي پاڻمرادو ميزبان ڪري سگهو ٿا. STT.ai جي اوپن سورس صفحي ۾ منصوبي جي ريپو ۽ وزن جي فهرست آهي. گھڻيون پيداوار جون ٽيمون اسان جي ميزبان ورزن کي GPU جي خريداري، ماڊل سوئپس ۽ آپشن کي ڇڏڻ لاءِ استعمال ڪن ٿيون.