Transcribe with Distil-Whisper

عام طور تي دستياب آڊيو ۽ وڊيو سان ڪم ڪري ٿو. DRM-protected مواد کي مدد نه ڏني وئي آهي.

وڌايل لاءِ اپ گريڊ
Private transcript
ٽرانسڪريٽ سان ڳالھايو
پرو سان کوليو →
فائل ھيڏانهن ڇڏ يا ڪلڪ ڪريو ته ڏسو
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — 2GB تائين
وڌايل لاءِ اپ گريڊ
Private transcript
ٽرانسڪريٽ سان ڳالھايو
پرو سان کوليو →
وڌايل لاءِ اپ گريڊ
رڪارڊنگ: 0:00
ريئل-ٽائم موکي (وقت)
وڌايل ويسپر (صحيح)
عام لنڪ: 24h، صرف متن · رجسٽر ٿيو 7d + آڊيو لاءِ · پرو پرائيويٽ لنڪ لاءِ

سچي وقت جي ڳالھائڻ کي متن ۾. AI پاڻمرادو درست ڪندو جيئن توھان ڳالھايو - دقت ڊگھي ڳالھائڻ سان بهتر ٿيندي.

پنھنجو مائڪروفون پھريون پرکي
❤️ STT.ai کي پيارو آهي؟ پنھنجن دوستن کي چئو!
توھان پنھنجي مفت ترميم استعمال ڪئي آھي

600 منٽ/مھينو حاصل ڪرڻ لاءِ مفت ۾ رجسٽر ٿيو، يا لامحدود ترڪيبون حاصل ڪرڻ لاءِ اپ گريڊ ڪريو.

10 مفت منٽ/ ڏينھن 600 منٽ مفت سان رجسٽريشن ڪو ڪريڊٽ ڪارڊ نه ڳجھي طرح محفوظ
مفت ۾ رجسٽر ٿيو →
5.8%
WER
99
Languages
48.0x
Speed
MIT
License

About Distil-Whisper

گھڻا پڇيل سوال

Distil-Whisper Hugging Face جو ڳالهائڻ-لکڻ ماڊل آھي. STT.ai Distil-Whisper کي اسان جي GPU جي بنياد تي ميزبان ڪري ٿو تنھنڪري توھان ان کي پنھنجي هارڊويئر جي فراهمي کانسواءِ استعمال ڪري سگھو ٿا - آڊيو يا وڊيو اپ لوڊ ڪريو ۽ ماڊل چونڊيندڙ مان Distil-Whisper چونڊيو.

معياري معيار تي، Distil-Whisper 5.8% لفظ غلطي جي شرح حاصل ڪري ٿو. حقيقي دنيا جي دقت آڊيو جي معيار، ڌيان ۽ ٻولي تي منحصر آهي؛ شور يا ڌيان رکندڙ رڪارڊنگ لاءِ، ڪجهه سيڪڙو پوائنٽس وڌيڪ WER جو اميد آهي.

Distil-Whisper STT.ai جي مفت سطح تي هلندو آهي - هر مهمان 600 منٽ / مهيني ۾ ڪابه رقم نه ٿي. ادا ڪيل منصوبا ڊگهي وقت تائين فائلن جي حدن، ذاتي نقلن ۽ ترجيح جي قطار ۾ شامل ڪن ٿا.

Distil-Whisper MIT تحت جاري ڪيو ويو آهي، هڪ آزاد-سرو لاڳاپو لائسنس. توهان Distil-Whisper کي پنهنجي هارڊويئر تي پاڻمرادو ميزبان ڪري سگهو ٿا يا اسان جي ميزبان ورزن کي استعمال ڪري سگهو ٿا - ٻئي تجارتي طور استعمال ڪري سگهجن ٿا.

Distil-Whisper 99 ٻوليون سپورٽ ڪري ٿو. خودڪار ڳولا گھڻن آڊيو لاءِ صحيح ٻولي چونڊيندي آهي؛ توهان ان کي پاڻمرادو به بيان ڪري سگهو ٿا ته جيئن صحيحي ۾ ٿورو اضافو ٿئي.

Distil-Whisper اسان جي GPUs تي تقريبن 48.0x ريئل ٽائيم تي آڊيو پروسيس ڪري ٿو. 1 ڪلاڪ جي آڊيو فائل 1 منٽن ۾ ختم ٿئي ٿي؛ ڊگهيون فائل ڪنڊي ۾ رکجن ۽ جڏهن مڪمل ٿئي ته اي ميل ذريعي اطلاع ڏين.

Distil-Whisper وٽ 756M ماڊل آھن. وڏا ماڊل وڌيڪ درست آھن پر سست آھن؛ STT.ai Distil-Whisper کي GPU تي ميزبان ڪري ٿو تنھنڪري ماڊل جي ڳاڻيٽي توھان جي ڪلائنٽ-سائڊ ڪارڪردگي تي اثر نه ٿا وجهن.

Distil-Whisper سڀ فارميٽ قبول ڪري ٿو STT.ai مدد — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, ۽ ٻيا. خروجي طور TXT, SRT, VTT, DOCX, JSON, يا PDF.

ها. هر هڪ نقل لاءِ Distil-Whisper سان گڏ ڳالهائيندڙ جي ڊياريزيشن هلندي آهي - هر هڪ ڳالهائيندڙ تي ٽيگ لڳل آهي ۽ توهان انهن جو نالو پوءِ ايڊيٽر ۾ تبديل ڪري سگهو ٿا.

ها. Distil-Whisper اسان جي انتظامي ماحول ۾ هلندو آهي - آڊيو پروسيس ڪيو ويندو آهي ۽ اڻ سڌي طرح حذف ڪيو ويندو آهي ۽ ڪڏهن به واضح طور تي داخل ٿيڻ کانسواءِ تربيت لاءِ استعمال نه ٿيندو آهي. پرو منصوبا وقف ٿيل ترڪيبن لاءِ ڪلائنٽ-سائڊ انڪرپشن شامل ڪندا آهن.

compare-stt ٽولز کي استعمال ڪريو Distil-Whisper کي ڪنهن به ٻئي مدد ڏنل ماڊل سان گڏ هڪ ئي آڊيو تي هلائڻ لاءِ - توهان WER، حصن جي ڳاڻيٽي، اسپيڪر جي ليڊس ۽ اعتماد جا نتيجا پاسي پاسي ڏسندا. Distil-Whisper vs Whisper Large V3 مقابلو سڀ کان عام هلندڙ آهي.

ھائو. /v1/transcribe endpoint تي ماڊل پيراميڊ طور "distil-whisper" جو بيان ڪريو. Python ۽ Node.js SDKs ۾ Distil-Whisper جا مثال شامل آهن. مفت API ٽيئر ۾ 100 منٽ/مھينو شامل آهن.

ها. ڇاڪاڻ ته Distil-Whisper MIT-ليزنٽ آهي، توهان ان کي پاڻمرادو ميزبان ڪري سگهو ٿا. STT.ai جي اوپن سورس صفحي ۾ منصوبي جي ريپو ۽ وزن جي فهرست آهي. گھڻيون پيداوار جون ٽيمون اسان جي ميزبان ورزن کي GPU جي خريداري، ماڊل سوئپس ۽ آپشن کي ڇڏڻ لاءِ استعمال ڪن ٿيون.