سان نقل ڪريو SenseVoice

Name: SenseVoice
Author: FunAudioLLM

عام طور تي دستياب آڊيو ۽ وڊيو سان ڪم ڪري ٿو. DRM-protected مواد کي مدد نه ڏني وئي آهي.

وڌايل لاءِ اپ گريڊ

پرائيويٽ ٽرانسڪرپٽ

ٽرانسڪريٽ سان ڳالھايو

پرو سان کوليو →

فائل ھيڏانهن ڇڏ يا ڪلڪ ڪريو ته ڏسو

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — 2GB تائين

ڪيتريون ئي فائل اپ لوڊ ڪريو پرو سان

وڌايل لاءِ اپ گريڊ

پرائيويٽ ٽرانسڪرپٽ

ٽرانسڪريٽ سان ڳالھايو

پرو سان کوليو →

وڌايل لاءِ اپ گريڊ

سچي وقت جي ڳالھائڻ کي متن ۾. AI پاڻمرادو درست ڪندو جيئن توھان ڳالھايو - دقت ڊگھي ڳالھائڻ سان بهتر ٿيندي.

پنھنجو مائڪروفون پھريون پرکي

10 مفت منٽ/ ڏينھن 600 منٽ مفت سان رجسٽريشن ڪو ڪريڊٽ ڪارڊ نه ڳجھي طرح محفوظ

مفت ۾ رجسٽر ٿيو →

5.5%

WER

ٻوليون

50.0x

رفتار

MIT

لائسنس

بابت SenseVoice

SenseVoice هڪ FunAudioLLM کان ڳالهائڻ بنياد ماڊل آهي جيڪو ترميم کان وڌيڪ وڃي ٿو. اهو 50+ ٻولين کي سپورٽ ڪري ٿو ۽ احساس سڃاڻپ، آڊيو واقعن جي ڳولا، ۽ هڪ ماڊل ۾ مخالف متن جي عام ڪرڻ جي صلاحيت شامل آهي.

مدد ڏنل ٻوليون SenseVoice

انگريزي

هسپانوي

فرانسيسي

جرمن

چيني

جاپاني

ڪوريائي

پورٽگليز

عربي

هندي

روسي

اطالوي

ڊچ

ترڪي

پولش

سويڊش

انڊونيشي

ٿائي

ويتنامي

چيڪ

يوناني

روماني

هنگري

عبراني

ڊينش

فنش

نارويجيائي

يوڪراني

ملي

بنگلا

ماڊل جي معلومات

مهيا ڪندڙFunAudioLLM
آرڪائيو-
لائسنسMIT
اپڊيٽ ٿيلMar 2026

لاڳاپيل ماڊل

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

گھڻا پڇيل سوال

SenseVoice FunAudioLLM جو ڳالهائڻ-لکڻ ماڊل آھي. STT.ai SenseVoice کي اسان جي GPU جي بنياد تي ميزبان ڪري ٿو تنھنڪري توھان ان کي پنھنجي هارڊويئر جي فراهمي کانسواءِ استعمال ڪري سگھو ٿا - آڊيو يا وڊيو اپ لوڊ ڪريو ۽ ماڊل چونڊيندڙ مان SenseVoice چونڊيو.

معياري معيار تي، SenseVoice 5.5% لفظ غلطي جي شرح حاصل ڪري ٿو. حقيقي دنيا جي دقت آڊيو جي معيار، ڌيان ۽ ٻولي تي منحصر آهي؛ شور يا ڌيان رکندڙ رڪارڊنگ لاءِ، ڪجهه سيڪڙو پوائنٽس وڌيڪ WER جو اميد آهي.

SenseVoice STT.ai جي مفت سطح تي هلندو آهي - هر هڪ مهمان 600 منٽن کي شروع ڪرڻ لاء ڪو به خرچ نه آهي. ادا ڪيل منصوبا وڌيڪ ڊگهي فائيل حدون، پرائيويٽ ٽرانسڪرپشن ۽ ترجيح واري قطار شامل ڪرڻ.

SenseVoice MIT تحت جاري ڪيو ويو آهي، هڪ آزاد-سرو لاڳاپو لائسنس. توهان SenseVoice کي پنهنجي هارڊويئر تي پاڻمرادو ميزبان ڪري سگهو ٿا يا اسان جي ميزبان ورزن کي استعمال ڪري سگهو ٿا - ٻئي تجارتي طور استعمال ڪري سگهجن ٿا.

SenseVoice 50 ٻوليون سپورٽ ڪري ٿو. خودڪار ڳولا گھڻن آڊيو لاءِ صحيح ٻولي چونڊيندي آهي؛ توهان ان کي پاڻمرادو به بيان ڪري سگهو ٿا ته جيئن صحيحي ۾ ٿورو اضافو ٿئي.

SenseVoice اسان جي GPUs تي تقريبن 50.0x ريئل ٽائيم تي آڊيو پروسيس ڪري ٿو. 1 ڪلاڪ جي آڊيو فائل 1 منٽن ۾ ختم ٿئي ٿي؛ ڊگهيون فائل ڪنڊي ۾ رکجن ۽ جڏهن مڪمل ٿئي ته اي ميل ذريعي اطلاع ڏين.

SenseVoice وٽ 234M ماڊل آھن. وڏا ماڊل وڌيڪ درست آھن پر سست آھن؛ STT.ai SenseVoice کي GPU تي ميزبان ڪري ٿو تنھنڪري ماڊل جي ڳاڻيٽي توھان جي ڪلائنٽ-سائڊ ڪارڪردگي تي اثر نه ٿا وجهن.

SenseVoice سڀ فارميٽ قبول ڪري ٿو STT.ai مدد — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, ۽ ٻيا. خروجي طور TXT, SRT, VTT, DOCX, JSON, يا PDF.

ها. هر هڪ نقل لاءِ SenseVoice سان گڏ ڳالهائيندڙ جي ڊياريزيشن هلندي آهي - هر هڪ ڳالهائيندڙ تي ٽيگ لڳل آهي ۽ توهان انهن جو نالو پوءِ ايڊيٽر ۾ تبديل ڪري سگهو ٿا.

ها. SenseVoice اسان جي انتظامي ماحول ۾ هلندو آهي - آڊيو پروسيس ڪيو ويندو آهي ۽ اڻ سڌي طرح حذف ڪيو ويندو آهي ۽ ڪڏهن به واضح طور تي داخل ٿيڻ کانسواءِ تربيت لاءِ استعمال نه ٿيندو آهي. پرو منصوبا وقف ٿيل ترڪيبن لاءِ ڪلائنٽ-سائڊ انڪرپشن شامل ڪندا آهن.

compare-stt ٽولز کي استعمال ڪريو SenseVoice کي ڪنهن به ٻئي مدد ڏنل ماڊل سان گڏ هڪ ئي آڊيو تي هلائڻ لاءِ - توهان WER، حصن جي ڳاڻيٽي، اسپيڪر جي ليڊس ۽ اعتماد جا نتيجا پاسي پاسي ڏسندا. SenseVoice vs Whisper Large V3 مقابلو سڀ کان عام هلندڙ آهي.

ھائو. /v1/transcribe endpoint تي ماڊل پيراميڊ طور "sensevoice" جو بيان ڪريو. Python ۽ Node.js SDKs ۾ SenseVoice جا مثال شامل آهن. مفت API ٽيئر ۾ 100 منٽ/مھينو شامل آهن.

ها. ڇاڪاڻ ته SenseVoice MIT-ليزنٽ آهي، توهان ان کي پاڻمرادو ميزبان ڪري سگهو ٿا. STT.ai جي اوپن سورس صفحي ۾ منصوبي جي ريپو ۽ وزن جي فهرست آهي. گھڻيون پيداوار جون ٽيمون اسان جي ميزبان ورزن کي GPU جي خريداري، ماڊل سوئپس ۽ آپشن کي ڇڏڻ لاءِ استعمال ڪن ٿيون.

سان نقل ڪريو SenseVoice

بابت SenseVoice

مدد ڏنل ٻوليون SenseVoice

ماڊل جي معلومات

لاڳاپيل ماڊل

گھڻا پڇيل سوال

SenseVoice ڇا آھي؟

SenseVoice ڪيترو صحيح آھي؟

SenseVoice استعمال ڪرڻ مفت آهي؟

SenseVoice ڪھڙي لائسنس استعمال ڪري ٿو؟

ڪيتريون ٻوليون SenseVoice سپورٽ ڪري ٿو؟

SenseVoice ڪيترو تيز آھي؟

SenseVoice ماڊل ڪيترو وڏو آھي؟

ڪهڙا آڊيو فارميٽ SenseVoice نقل ڪري سگھن ٿا؟

SenseVoice ڪيترن ئي اسپيڪر کي ڳولي ٿو؟

SenseVoice استعمال ڪندي منھنجو ڊيٽا پرائيويٽ آھي؟

SenseVoice کي ٻين STT ماڊلن سان ڪيئن مقابلو ڪيو وڃي؟

آءٌ API ذريعي SenseVoice استعمال ڪري سگهان ٿو؟

آءٌ پنھنجي سرور تي SenseVoice هلائي سگهان ٿو؟