Transcribe with SenseVoice

عام طور تي دستياب آڊيو ۽ وڊيو سان ڪم ڪري ٿو. DRM-protected مواد کي مدد نه ڏني وئي آهي.

وڌايل لاءِ اپ گريڊ
Private transcript
ٽرانسڪريٽ سان ڳالھايو
پرو سان کوليو →
فائل ھيڏانهن ڇڏ يا ڪلڪ ڪريو ته ڏسو
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — 2GB تائين
وڌايل لاءِ اپ گريڊ
Private transcript
ٽرانسڪريٽ سان ڳالھايو
پرو سان کوليو →
وڌايل لاءِ اپ گريڊ
رڪارڊنگ: 0:00
ريئل-ٽائم موکي (وقت)
وڌايل ويسپر (صحيح)
عام لنڪ: 24h، صرف متن · رجسٽر ٿيو 7d + آڊيو لاءِ · پرو پرائيويٽ لنڪ لاءِ

سچي وقت جي ڳالھائڻ کي متن ۾. AI پاڻمرادو درست ڪندو جيئن توھان ڳالھايو - دقت ڊگھي ڳالھائڻ سان بهتر ٿيندي.

پنھنجو مائڪروفون پھريون پرکي
❤️ STT.ai کي پيارو آهي؟ پنھنجن دوستن کي چئو!
توھان پنھنجي مفت ترميم استعمال ڪئي آھي

600 منٽ/مھينو حاصل ڪرڻ لاءِ مفت ۾ رجسٽر ٿيو، يا لامحدود ترڪيبون حاصل ڪرڻ لاءِ اپ گريڊ ڪريو.

10 مفت منٽ/ ڏينھن 600 منٽ مفت سان رجسٽريشن ڪو ڪريڊٽ ڪارڊ نه ڳجھي طرح محفوظ
مفت ۾ رجسٽر ٿيو →
5.5%
WER
50
Languages
50.0x
Speed
MIT
License

About SenseVoice

گھڻا پڇيل سوال

SenseVoice FunAudioLLM جو ڳالهائڻ-لکڻ ماڊل آھي. STT.ai SenseVoice کي اسان جي GPU جي بنياد تي ميزبان ڪري ٿو تنھنڪري توھان ان کي پنھنجي هارڊويئر جي فراهمي کانسواءِ استعمال ڪري سگھو ٿا - آڊيو يا وڊيو اپ لوڊ ڪريو ۽ ماڊل چونڊيندڙ مان SenseVoice چونڊيو.

معياري معيار تي، SenseVoice 5.5% لفظ غلطي جي شرح حاصل ڪري ٿو. حقيقي دنيا جي دقت آڊيو جي معيار، ڌيان ۽ ٻولي تي منحصر آهي؛ شور يا ڌيان رکندڙ رڪارڊنگ لاءِ، ڪجهه سيڪڙو پوائنٽس وڌيڪ WER جو اميد آهي.

SenseVoice STT.ai جي مفت سطح تي هلندو آهي - هر مهمان 600 منٽ / مهيني ۾ ڪابه رقم نه ٿي. ادا ڪيل منصوبا ڊگهي وقت تائين فائلن جي حدن، ذاتي نقلن ۽ ترجيح جي قطار ۾ شامل ڪن ٿا.

SenseVoice MIT تحت جاري ڪيو ويو آهي، هڪ آزاد-سرو لاڳاپو لائسنس. توهان SenseVoice کي پنهنجي هارڊويئر تي پاڻمرادو ميزبان ڪري سگهو ٿا يا اسان جي ميزبان ورزن کي استعمال ڪري سگهو ٿا - ٻئي تجارتي طور استعمال ڪري سگهجن ٿا.

SenseVoice 50 ٻوليون سپورٽ ڪري ٿو. خودڪار ڳولا گھڻن آڊيو لاءِ صحيح ٻولي چونڊيندي آهي؛ توهان ان کي پاڻمرادو به بيان ڪري سگهو ٿا ته جيئن صحيحي ۾ ٿورو اضافو ٿئي.

SenseVoice اسان جي GPUs تي تقريبن 50.0x ريئل ٽائيم تي آڊيو پروسيس ڪري ٿو. 1 ڪلاڪ جي آڊيو فائل 1 منٽن ۾ ختم ٿئي ٿي؛ ڊگهيون فائل ڪنڊي ۾ رکجن ۽ جڏهن مڪمل ٿئي ته اي ميل ذريعي اطلاع ڏين.

SenseVoice وٽ 234M ماڊل آھن. وڏا ماڊل وڌيڪ درست آھن پر سست آھن؛ STT.ai SenseVoice کي GPU تي ميزبان ڪري ٿو تنھنڪري ماڊل جي ڳاڻيٽي توھان جي ڪلائنٽ-سائڊ ڪارڪردگي تي اثر نه ٿا وجهن.

SenseVoice سڀ فارميٽ قبول ڪري ٿو STT.ai مدد — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, ۽ ٻيا. خروجي طور TXT, SRT, VTT, DOCX, JSON, يا PDF.

ها. هر هڪ نقل لاءِ SenseVoice سان گڏ ڳالهائيندڙ جي ڊياريزيشن هلندي آهي - هر هڪ ڳالهائيندڙ تي ٽيگ لڳل آهي ۽ توهان انهن جو نالو پوءِ ايڊيٽر ۾ تبديل ڪري سگهو ٿا.

ها. SenseVoice اسان جي انتظامي ماحول ۾ هلندو آهي - آڊيو پروسيس ڪيو ويندو آهي ۽ اڻ سڌي طرح حذف ڪيو ويندو آهي ۽ ڪڏهن به واضح طور تي داخل ٿيڻ کانسواءِ تربيت لاءِ استعمال نه ٿيندو آهي. پرو منصوبا وقف ٿيل ترڪيبن لاءِ ڪلائنٽ-سائڊ انڪرپشن شامل ڪندا آهن.

compare-stt ٽولز کي استعمال ڪريو SenseVoice کي ڪنهن به ٻئي مدد ڏنل ماڊل سان گڏ هڪ ئي آڊيو تي هلائڻ لاءِ - توهان WER، حصن جي ڳاڻيٽي، اسپيڪر جي ليڊس ۽ اعتماد جا نتيجا پاسي پاسي ڏسندا. SenseVoice vs Whisper Large V3 مقابلو سڀ کان عام هلندڙ آهي.

ھائو. /v1/transcribe endpoint تي ماڊل پيراميڊ طور "sensevoice" جو بيان ڪريو. Python ۽ Node.js SDKs ۾ SenseVoice جا مثال شامل آهن. مفت API ٽيئر ۾ 100 منٽ/مھينو شامل آهن.

ها. ڇاڪاڻ ته SenseVoice MIT-ليزنٽ آهي، توهان ان کي پاڻمرادو ميزبان ڪري سگهو ٿا. STT.ai جي اوپن سورس صفحي ۾ منصوبي جي ريپو ۽ وزن جي فهرست آهي. گھڻيون پيداوار جون ٽيمون اسان جي ميزبان ورزن کي GPU جي خريداري، ماڊل سوئپس ۽ آپشن کي ڇڏڻ لاءِ استعمال ڪن ٿيون.