English Transcription

Convert English (English) audio to text with AI. Fast, accurate, 10+ models.

عام طور تي دستياب آڊيو ۽ وڊيو سان ڪم ڪري ٿو. DRM-protected مواد کي مدد نه ڏني وئي آهي.

وڌايل لاءِ اپ گريڊ
Private transcript
ٽرانسڪريٽ سان ڳالھايو
پرو سان کوليو →
فائل ھيڏانهن ڇڏ يا ڪلڪ ڪريو ته ڏسو
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — 2GB تائين
وڌايل لاءِ اپ گريڊ
Private transcript
ٽرانسڪريٽ سان ڳالھايو
پرو سان کوليو →
وڌايل لاءِ اپ گريڊ
رڪارڊنگ: 0:00
ريئل-ٽائم موکي (وقت)
وڌايل ويسپر (صحيح)
عام لنڪ: 24h، صرف متن · رجسٽر ٿيو 7d + آڊيو لاءِ · پرو پرائيويٽ لنڪ لاءِ

سچي وقت جي ڳالھائڻ کي متن ۾. AI پاڻمرادو درست ڪندو جيئن توھان ڳالھايو - دقت ڊگھي ڳالھائڻ سان بهتر ٿيندي.

پنھنجو مائڪروفون پھريون پرکي
❤️ STT.ai کي پيارو آهي؟ پنھنجن دوستن کي چئو!
توھان پنھنجي مفت ترميم استعمال ڪئي آھي

600 منٽ/مھينو حاصل ڪرڻ لاءِ مفت ۾ رجسٽر ٿيو، يا لامحدود ترڪيبون حاصل ڪرڻ لاءِ اپ گريڊ ڪريو.

10 مفت منٽ/ ڏينھن 600 منٽ مفت سان رجسٽريشن ڪو ڪريڊٽ ڪارڊ نه ڳجھي طرح محفوظ
مفت ۾ رجسٽر ٿيو →

Best Models for English

Model Provider WER Speed
STT.ai Enhanced Best STT.ai 3.2% Try it
Whisper Large V3 OpenAI 4.2% Try it
Whisper Turbo OpenAI 5.1% Try it
NVIDIA Canary NVIDIA 3.5% Try it
Moonshine Useful Sensors 7.8% Try it
NVIDIA Parakeet NVIDIA 3.0% Try it
SenseVoice FunAudioLLM 5.5% Try it
Distil-Whisper Hugging Face 5.8% Try it
Vosk Alpha Cephei 12.0% Try it

بابت English Transcription

English is the most widely spoken language globally and the dominant language for business, technology, and international communication. STT.ai provides industry-leading English speech recognition across all major accents including American, British, Australian, and Indian English.

STT.ai state-of-the-art مهيا ڪري ٿو English ائٽمڪس ائٽمڪس هڪ ائٽمڪس پروگرام آهي جيڪو ڪيترن ئي ائٽمڪس ماڊلز سان گڏ آواز جي سڃاڻپ ڪري ٿو. English, اسان جو پليٽ فارم خودڪار طور تي ٻولي جو اندازو لڳائي ۽ بهترين دقت لاءِ بهترين ماڊل چونڊيندو.

ڪيترو صحيح آھي English ترڪيب

دقت English transcription آڊيو معيار تي منحصر آهي، اسپيڪر روشني، پس منظر شور، ۽ توهان چونڊيو ماڊل. هڪ اسپيڪر سان صاف آڊيو تي، اسان جي بهترين ماڊل لاء 6% هيٺ لفظ غلطي جي شرح (WER) حاصل English -- انسان جي سطح جي دقت کي ويجهو.

بهترين نتيجن لاءِ English آڊيو، اسان صلاح ڏيون ٿا:

  • آڊيو صاف ڪريو -- پس منظر جي رنوين کي گهٽائي ۽ سٺو مائڪروفون استعمال ڪريو
  • هڪڙو اسپيڪر -- ٻن يا وڌيڪ اسپيڪر ريڪارڊنگ لاءِ اسپيڪر ڊيائريزيشن کي فعال ڪريو
  • صحيح ماڊل چونڊيو -- NVIDIA Canary مدد ڪيل ٻولين لاءِ تمام گهٽ WER پيش ڪري ٿو، جڏهن ته Whisper Large V3 سڀ کان ويڪ ٻولين جي کوٽائي فراهم ڪري ٿو
  • ٻولي بيان ڪريو -- جڏهن ته خودڪار ڳولا سٺي ڪم ڪري ٿي ، پاڻمرادو چونڊڻ English دقت ٿورو بهتر ڪري سگھي ٿو

رپورٽ فارميٽ English ترانسڪريپٽ

توهان جي transcribing کانپوءِ English آڊيو، نتيجو ھنن فارميٽن مان ڪنھن ھڪ ۾ ڊائون لوڊ ڪريو:

TXT
عام متن جي ترانسڪريپشن
SRT
وقت جي نشان سان سب تي
VTT
ويب وڊيو عنوان
DOCX
ورڈ دڪان
JSON
وقت جي نشان سان ٺهيل ڊيٽا
PDF
پرنٽ ڪرڻ لاءِ تيار ٿيل دڪان

گھڻا پڇيل سوال

STT.ai ۾ آڊيو يا وڊيو فائل اپ لوڊ ڪريو جنھن ۾ English (English) شامل آھي يا URL کي چٽيو. اھڙو ماڊل چونڊيو جنھن English کي سپورٽ ڪري - بهترين نتيجن لاءِ مٿين ٽيبل تي تمام ننڍي WER سان چونڊيو - ۽ ترانسڪريپ تي ڪلڪ ڪريو.

STT.ai هر مھيني 600 مفت منٽ / مهيني ڏئي ٿو، جنهن ۾ English (1.5 billion عالمي سطح تي ڳالهائيندڙ) شامل آهن. توهان جي پهرين فائيل لاءِ ڪا به رجسٽريشن جي ضرورت ناهي. 5 / مهيني ۾ شروع ٿيندڙ منصوبا ڊگهي فائلن ۽ پرائيويٽ ٽرانسڪرپشن کي کوليو.

English صاف آڊيو تي درستگي اسان جي بهترين ماڊلز سان 93-96% تائين پهچي ٿي. نمبر، صحيح نالا، ۽ ڦيرائڻ وارا فارم سڀئي هلايا ويندا آهن. صاف آڊيو گهٽ ۾ گهٽ پس منظر جي راش سان بهترين نتيجا پيدا ڪندو آهي.

مٿي جدول WER طرفان English لاء مدد ڪيل ماڊل جي درجه بندي (لوڻ بهتر آهي). Whisper وڏي V3 سڀ کان ويڪ English coverage آهي; NVIDIA Canary تي سڀ کان گهٽ WER مدد English قسمن تي آهي; STT.ai Enhanced ٻنهي جي لاء ادا ڪيل منصوبن جي اتحاد.

ھائو. English آڌار ۾ نشان لڳائڻ (ڊائيٽس، ڪمان، سوالي نشان) ۽ صحيح ڪيس شامل آهن. نمبر ۽ عنوان English جي معاهدن تي عمل ڪن ٿا. ترانسڪريپٽ ايڊيٽر توهان کي نشان لڳائڻ کي پاڻمرادو ترتيب ڏيڻ جي اجازت ڏئي ٿو.

ھائو. ڳالهائيندڙ جي ڊيائريزيشن ٻولي-اڻ ڄاڻ آهي ۽ English تي ڪم ڪري ٿي جيئن انگريزي ۾ ڪم ڪري ٿي. هر ڳالهائيندڙ کي ٽيگ ڏنو ويو آهي (ٻوليندڙ 1، ڳالهائيندڙ 2،...) ۽ توهان انهن جو نالو ترنسڪريشن کانپوءِ ايڊيٽر ۾ مٽائي سگهو ٿا.

گھڻيون English فائلون 5 منٽن ۾ نقل ڪيون وينديون آهن. 1 ڪلاڪ جي English آڊيو فائل عام طور تي اسان جي تيز ماڊلن سان 2-3 منٽ وٺي ٿي، ۽ اعليٰ دقت وارن ماڊلن سان ٿورو وڌيڪ.

MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, ۽ 10+ ٻين فارميٽس ۾ English فائلون سڀ ڪم. TXT, SRT, VTT, DOCX, JSON, ۽ PDF کي نڪتو - English متن سان گڏ سڀ.

ها. English آڊيو فائلون پروسيس ۽ گمنام طور تي حذف ڪيو ويو. پرو منصوبا ڪلائنٽ-سائڊ انڪرپشن شامل ڪريو - جيتوڻيڪ جيڪڏهن اسان جي ڊيٽابيس ۾ ڀڃڪڙي ڪئي وئي آهي، توهان جي ترنسڪريٽس توهان جي ڪوڊ کانسواءِ پڙهڻ جي قابل نه آهن. English ڊيٽا ڪڏهن به واضح طور تي داخل ٿيڻ کانسواءِ ماڊل تربيت لاءِ استعمال نه ڪيو ويندو آهي.

ها. SRT يا VTT طور ترانسڪريٽ کي برآمد ڪريو - ٻئي يوٽيوب، ويميو، ٽڪ ٽاڪ ۽ سڀني وڏين وڊيو پليٽ فارمن سان ڪم ڪن ٿا. برائون-سيٽائيٽس ٽولز انهن کي وڊيو تي هارڊ سبس جي طور تي مٿاڇري تي رکي ٿو.

ھائو. English جي ترجمي کان پوءِ، سبٽائيٽل-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير-تصوير

ھائو. REST API English کي ٻوليءَ جي ماپ جي ذريعي مدد ڪري ٿو (آٽو-دسترخوان به موجود آهي). Python ۽ Node.js SDKs توهان کي English آڊيو کي مڪمل وقت جي نشانن ۽ اسپيڪر جي نشانن سان گڏ هڪ دفعي ۾ نقل ڪرڻ جي اجازت ڏين ٿا.

English لاءِ، وڏيون درستگي جون تبديليون پس منظر جي راش، اسپيڪر جي مٿاڇري ۽ ڌيان جي طاقت آهن. هڪ سٺو مائڪروفون استعمال ڪريو، جڏھن ممڪن هجي ته ڌار اسپيڪر، ۽ مناسب ٻوليءَ تي تربيت يافته ماڊل چونڊيو.