English Transcription
Convert English (English) audio to text with AI. Fast, accurate, 10+ models.
Best Models for English
| Model | Provider | WER | Speed | |
|---|---|---|---|---|
| STT.ai Enhanced Best | STT.ai | 3.2% | Try it | |
| Whisper Large V3 | OpenAI | 4.2% | Try it | |
| Whisper Turbo | OpenAI | 5.1% | Try it | |
| NVIDIA Canary | NVIDIA | 3.5% | Try it | |
| Moonshine | Useful Sensors | 7.8% | Try it | |
| NVIDIA Parakeet | NVIDIA | 3.0% | Try it | |
| SenseVoice | FunAudioLLM | 5.5% | Try it | |
| Distil-Whisper | Hugging Face | 5.8% | Try it | |
| Vosk | Alpha Cephei | 12.0% | Try it |
په اړه English Transcription
English is the most widely spoken language globally and the dominant language for business, technology, and international communication. STT.ai provides industry-leading English speech recognition across all major accents including American, British, Australian, and Indian English.
STT.ai د هنر حالت چمتو کوي English د وینا د پیژندلو د څو AI ماډلونه ځواک. که تاسو ته اړتيا لري چې په مرکې، د درسونو، podcasts، يا غونډو کې د ليکلو English. زموږ پلیټ په اتوماتيک ډول ژبه کشف کوي او د غوره دقت لپاره غوره ماډل غوره کوي.
څومره سم دی English لېږدول غواړﺉ؟
د English د ژباړې د غږ د کیفیت، د سفير د روښانتیا، د پس منظر د شور، او د ماډل تاسو غوره پورې اړه لري. په پاک غږ سره د يو واحد سفير، زموږ د غوره ماډلونو د 6٪ لپاره د کلمه د خطا د کچې (WER) تر لاسه English - د انسان د کچې دقت ته نږدې.
د غوره پایلو سره English غږيز، موږ سپارښتنه کوو:
- غږ پاکول -- شاليد غږ کمول او ښه غږيزه غږيزه کارول
- يو غږونکی برخې د ګڼ- غږوونکي ثبتونو لپاره غږوونکي ورځپاڼه توانول --
- سم ماډل وټاکئ - NVIDIA Canary د ملاتړ ژبو لپاره ترټولو ټیټ WER وړاندې کوي، پداسې حال کې چې Whisper Large V3 د پراخه ژبې پوښښ وړاندې کوي
- ژبه وټاکﺉ -- که چېرې خپلکارې کشف ښه کار کوي، لاسي ټاکل English کولای شي دقت لږ ښه کړي
د English لېږدونه
وروسته د خپل د ليکلو English غږيز، په دې بڼو کې د پایلې ډاونلوډ:
TXT
ساده ليکنه
SRT
سرليکونه د مهال نښانو سره
VTT
ګورت ويډيو سرليکونه
DOCX
وېرډ لاسوند
JSON
جوړښتونه اومتوک سره timestamps
PDF
لاسوند چاپول
ډېرې پوښتنې
د STT.ai ته د English (English) یا د URL سره یو آډیو یا ویډیو فایل پورته کړئ. یو ماډل غوره کړئ چې English ملاتړ کوي - د غوره پایلو لپاره د جدول په سر کې د ټیټ WER سره یو غوره کړئ - او کلیک وکړئ.
هو. STT.ai هر لیدونکی د 600 وړیا دقیقې / میاشت ورکوي، چې پکې د English (1.5 billion غږونکي په ټوله نړۍ کې) شامل دي. ستاسو د لومړي فایل لپاره هیڅ ډول راجستر کول نه دي. د $ 5 / میاشتې په پیل کې د تادیې پلانونه اوږدې فایلونه او شخصي نقلونه خلاصوي.
د English دقت په پاکو غږیزو زموږ د غوره ماډلونو سره 93-96٪ ته رسیږي. شمیرې، مناسب نومونه، او inflected فورمې ټول اداره کیږي. د لږترلږه پس منظر غږ سره روښانه غږ غوره پایلې تولیدوي.
د WER لخوا د English لپاره ملاتړ شوي ماډلونه پورته جدول کې درجه بندي کیږي (ټیټ ښه دی). د ویسپیر لوی V3 د English پراخه پوښښ لري؛ د NVIDIA کانري د ملاتړ English ډولونو کې ترټولو ټیټ WER لري؛ STT.ai Enhanced د پیسو پلانونو لپاره دواړه یوځای کوي.
هو. د English محصول کې د نښانو (دورې، کمې، پوښتنې نښې) او مناسب کیسین شامل دي. شمیرې او سرلیکونه د English کنوانسیونونو تعقیب کوي. د نقل کولو مدیر تاسو ته اجازه درکوي چې په لاسي ډول نښانونه وګورئ.
هو. د وینا کونکي ډیاریزیشن د ژبې agnostic دی او د English په کار کوي په ورته ډول چې دا په انګلیسي کې کوي. هر وینا کونکی لیبل شوی (د وینا کونکي 1، وینا کونکی 2،...) او تاسو کولی شئ د لیږد وروسته په مدیر کې دوی نوم بدل کړئ.
ډیری English فایلونه په 5 دقیقو کې لیکل شوي. د 1 ساعت English آډیو فایل معمولا زموږ د چټکو ماډلونو سره 2-3 دقیقې نیسي، او د لوړ دقیق ماډلونو سره لږترلږه اوږد.
په MP3، WAV، M4A، FLAC، OGG، MP4، MKV، MOV، WebM، AVI، او 10+ نورو بڼو ټول کار English دوتنې. ته TXT، SRT، VTT، DOCX، JSON، او PDF محصول - سره English متن ټول ناپاک.
هو. د English آډیو فایلونه د تل لپاره پروسس او حذف شوي. د پرو پلانونه د پیرودونکي اړخ کوډ کول اضافه کوي - حتی که زموږ ډیټابیس مات شي، ستاسو نقلونه ستاسو د کیلي پرته غیر قابل لوستلو دي. د English ډاټا هیڅکله د واضح انتخاب پرته د ماډل روزنې لپاره نه کارول کیږي.
هو. د SRT یا VTT په توګه د نقلونو صادرول - دواړه د یوټیوب، ویمیو، ټیک ټاک، او ټولو لوی ویډیو پلیټ فارمونو سره کار کوي. د سوځولو-سرلیکونو وسیله د هارډسونو په توګه ویډیو ته وده ورکوي.
هو. د English د لیږدولو وروسته، د سرلیک-ترجیم وسیله کولی شي د 100 + هدف ژبو څخه کوم یو ته د SRT / VTT ژباړې کړي. ګټور که ستاسو د English مینځپانګې د پراخه لیدونکو لپاره د سرلیکونو اړتیاوې ولري.
هو. د REST API د ژبې پارامتر له لارې English ملاتړ کوي (خودکار کشف هم شتون لري). د پایټن او نوډ. جی ایس SDKs تاسو ته اجازه درکوي چې د بشپړ وخت ټایسټم او سکرین لیبلونو سره د English آډیو سره لیږدول.
د English لپاره، تر ټولو لوی دقت متحولونه د پس منظر غږ، د غږونو غږونه، او د غږونو ځواک دي. یو ښه مایکروفون وکاروئ، کله چې ممکنه وي، او د اړونده ژبې په اړه روزل شوی ماډل غوره کړئ.