کے ساتھ ٹرانسکرائب SenseVoice

عوامی طور پر دستیاب آڈیو اور ویڈیو کے ساتھ کام کرتا ہے. DRM-محفوظ مواد کو مدد نہیں دی جاتی.

بہتری کے لیے اپگریڈ
Private transcript
نقل کے ساتھ گفتگو کریں
پرو کے ساتھ تالک کھولیں →
فائلیں یہاں ڈالیں یا براؤز کرنے کے لیے کلک کریں
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM - 2GB تک
بہتری کے لیے اپگریڈ
Private transcript
نقل کے ساتھ گفتگو کریں
پرو کے ساتھ تالک کھولیں →
بہتری کے لیے اپگریڈ
ریکارڈنگ: 0:00
رئیل ٹائم موشی (حالی)
بہتر چپکے سے (صحيح)
عوامی رابطے: 24h، صرف متن · رجسٹر کریں 7d + آڈیو کے لیے · پرو نجی لنکس کے لیے

رئل ٹائم اسپیکینگ سے ٹیکسٹ. AI خودکار طور پر درست کرتا ہے جیسے آپ بولتے ہیں - صحیح بات بولنے سے بہتر ہوتا ہے

پہلے اپنا مائیکرو فون جانچیں
❤️ STT.ai سے محبت؟ اپنے دوستوں کو بتاؤ!
آپ نے اپنے مفت نقل استعمال کر رہے ہیں

600 منٹ / ماہ حاصل کرنے کے لئے مفت میں رجسٹر کریں، یا لامحدود نقل کے لئے اپگریڈ کریں.

10 مفت منٹ/دن 600 منٹ مفت میں رجسٹر کوئی کریڈٹ کارڈ نہیں خفیہ
مفت میں رجسٹر کریں →
5.5%
WER
50
Languages
50.0x
Speed
MIT
License

کے بارے میں SenseVoice

SenseVoice is a speech foundation model from FunAudioLLM that goes beyond transcription. It supports 50+ languages and includes capabilities for emotion recognition, audio event detection, and inverse text normalization in a single model.

عام سوالات

SenseVoice FunAudioLLMکے ذريعے SenseVoiceکا FunAudioLLMکے ذريعے FunAudioLLMکا SenseVoiceکا SenseVoiceکا STT.aiہوسٹ کر تا هے تاکہ آپ اسے استعمال کر سکيں بغير آپکے خود کے ہارڈ و يرڈ کے آپلوڈ کر نے کے آڊيو يا ويڈیو اور ماڈل منتخب کر نے والے سے SenseVoiceکو منتخب کر نے کے

معیاری معیاروں پر، SenseVoice 5.5% ورڈ ایرر ریٹ حاصل کرتا ہے. حقیقی دنیا میں دقت آڈیو کی کیفیت، لہجہ اور زبان پر منحصر ہے؛ شوردار یا لہجہ والی ریکارڈنگ کے لیے، چند فیصد پوائنٹوں کی توقع کریں WER زیادہ.

SenseVoice STT.ai کے مفت سطح پر چلتا ہے - ہر مہمان کو 600 منٹ / ماہ کوئی خرچ نہیں ہوتا. ادا کردہ منصوبے پر فائیل زیادہ حدیں، نجی نقل، اور ترجیح کی قطار لگاتے ہیں.

SenseVoice کو MIT کے تحت آزاد کیا گیا ہے، ایک اجازت دار اوپن سورس لائسنس. آپ اپنے ہیڈریڈر پر خود-ہسٹ SenseVoice استعمال کرسکتے ہیں یا ہماری مہمانداری ورژن استعمال کرسکتے ہیں - دونوں تجارتی طور پر استعمال کی جاسکتے ہیں.

SenseVoice 50 زبانوں کو مدد دیتا ہے. خودکار دریافت زیادہ تر آڈیوز کے لیے صحیح زبان کو منتخب کرتا ہے؛ آپ اسے چھوٹے صحیح لیفت کے لیے ہاتھ سے بھی بیان کرسکتے ہیں.

SenseVoice ہمارے GPUs پر 50.0x ریئل ٹائم پر آڈیو پروسیسنگ کرتا ہے. ایک 1 گھنٹہ آڈیو فائل 1 منٹ میں ختم ہوتی ہے؛ لمبی فائل کی قطار اور جب ختم ہو جائے تو ای میل کے ذریعے اطلاع دی جائے گی.

SenseVoice ميں 234M پارا مڈل هے. بڑ ماڈل زیادہ صحيح هے مگر سست هے STT.ai GPU پر SenseVoice ميزبان هے اس ليے پارا مڈل شماري آپکے کلائنٹ سا يد پرفارمنس کو متاثر نہیں کر تا

SenseVoice ہر فارمیٹ قبول کرتا ہے جو STT.ai حمایت کرتا ہے - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, اور باقی. TXT, SRT, VTT, DOCX, JSON, or PDF کے طور پر خروجی.

ہاں۔ ہر نقل کے لئے SenseVoice کے ساتھ ساتھ اسپیکر ڈائریزیشن چلتا ہے۔ ہر اسپیکر کو لیبل دیا جاتا ہے اور آپ بعد میں ایڈیٹر میں ان کا نام بدل سکتے ہیں۔

ہاں. SenseVoice ہمارے انتظامی ماحول میں چلتا ہے - آڈیو کو پروسیسنگ اور ڈیفالٹ کے طور پر حذف کیا جاتا ہے اور واضح آپٹ-ان کے بغیر تربیت کے لئے کبھی استعمال نہیں کیا جاتا. پرو منصوبے آرام میں نقل کے لئے کلائنٹ-سایڈ انکریفٹنگ شامل کرتے ہیں.

SenseVoice کو ایک ہی آڈیو پر کسی بھی دوسرے مدد شدہ ماڈل کے خلاف چلانے کے لیے comparison-stt ٹول استعمال کریں - آپ WER، سگمنٹ گنتی، اسپیکر لیبلز، اور اعتماد کے سکور دیکھیں گے. SenseVoice vs Whisper Large V3 موازنہ سب سے عام چلتا ہے.

جی ہاں. /v1/transcribe انتہا پوائنٹ پر ماڈل پیرامیٹر کے طور پر "sensevoice" کو بیان کریں. Python اور Node.js SDKs میں SenseVoice مثالیں شامل ہیں. مفت API سطح میں 100 منٹ/مہینت شامل ہیں.

جی ہاں. کیونکہ SenseVoice MIT لائسنس ہے، آپ اسے خود مہمان بنا سکتے ہیں. STT.ai کے اوپن سورس صفحے پر پروجیکٹ ریپو اور وزن کی فہرست ہے. زیادہ تر پروڈکشن ٹیم GPU کی فراہمی کو چھوڑنے کے ليے ہمارے مہمانہ ورژن کا استعمال کرتے هے، ماڈل سواپ اور آپس.