English Transcription

Convert English (English) audio to text with AI. Fast, accurate, 10+ models.

জনসাধাৰণৰ বাবে উপলব্ধ অডিঅ' আৰু ভিডিঅ'ৰ সৈতে কাম কৰে। DRM-প্ৰতিৰক্ষা কৰা সমল সমৰ্থিত নহয়।

উন্নত কৰাৰ বাবে উন্নত কৰক
Private transcript
অনুলিপিৰ সৈতে চেট কৰক
Pro ৰ সৈতে আনলক কৰক →
নথিপত্ৰ এখানে স্থাপন কৰক অথবা ব্ৰাউছ কৰিবলৈ ক্লিক কৰক
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — ২GB ৰ ভিতৰত
উন্নত কৰাৰ বাবে উন্নত কৰক
Private transcript
অনুলিপিৰ সৈতে চেট কৰক
Pro ৰ সৈতে আনলক কৰক →
উন্নত কৰাৰ বাবে উন্নত কৰক
ৰেকৰ্ডিং: 0:00
ৰিয়েল-টাইম মোম (অবিলম্বে)
উন্নত উচুপি উচুপি (সঠিক)
ৰাজহুৱা লিঙ্ক: ২৪ ঘন্টা, কেৱল টেক্সট · নিবন্ধন কৰক 7d + অডিঅ'ৰ বাবে · প্ৰো ব্যক্তিগত লিঙ্কসমূহৰ বাবে

ৰিয়েল-টাইম কথোপকথনক টেক্সটত ৰূপান্তৰ কৰক। আপুনি কথোপকথন কৰাত AI এ স্বয়ংক্ৰিয়ভাবে সঠিক কৰে - দীঘল কথোপকথনৰ সৈতে সঠিকতা উন্নত হয়।

প্ৰথমে আপোনাৰ মাইক্রোফোন পৰীক্ষা কৰক
❤️ STT.ai ভাল পায়? আপোনাৰ বন্ধুসকলক কওক!
আপুনি আপোনাৰ মুক্ত অনুবাদ ব্যৱহাৰ কৰিছে

৬০০ মিনিট/মাহ লাভ কৰিবলৈ বিনামূলীয়াকৈ নিবন্ধন কৰক, অথবা অসীমিত অনুবাদৰ বাবে আপগ্ৰেড কৰক।

১০ মুক্ত মিনিট/দিন 600 মিনিট বিনামূলীয়া ক্ৰেডিট কাৰ্ড নাই এনক্ৰিপ্ট কৰা
বিনামূল্যে নিবন্ধন কৰক →

Best Models for English

Model Provider WER Speed
STT.ai Enhanced Best STT.ai 3.2% Try it
Whisper Large V3 OpenAI 4.2% Try it
Whisper Turbo OpenAI 5.1% Try it
NVIDIA Canary NVIDIA 3.5% Try it
Moonshine Useful Sensors 7.8% Try it
NVIDIA Parakeet NVIDIA 3.0% Try it
SenseVoice FunAudioLLM 5.5% Try it
Distil-Whisper Hugging Face 5.8% Try it
Vosk Alpha Cephei 12.0% Try it

বিষয়ে English Transcription

English is the most widely spoken language globally and the dominant language for business, technology, and international communication. STT.ai provides industry-leading English speech recognition across all major accents including American, British, Australian, and Indian English.

STT.ai ৰ দ্বাৰা আধুনিক প্ৰযুক্তি উপলব্ধ কৰা হৈছে English বহু AI মডেল দ্বাৰা শক্তিশালী শব্দ স্বীকৃতি। আপুনি সাক্ষাৎকাৰ, পাঠ, পডকাস্ট বা সভাসমূহ অনুবাদ কৰিব লাগিব নে নাই Englishআমাৰ প্লেটফৰ্মে স্বয়ংক্ৰিয়ভাৱে ভাষা চিনাক্ত কৰে আৰু সৰ্বোত্তম সঠিকতাৰ বাবে উপযুক্ত মডেল নিৰ্বাচন কৰে।

সঠিকতা কিমান English অনুবাদ?

ইয়াৰ বাবে সঠিকতা English অনুবাদ অডিঅ'ৰ গুণমান, স্পিকারৰ স্পষ্টতা, পটভূমিৰ শব্দ আৰু আপুনি নিৰ্বাচন কৰা মডেলৰ ওপৰত নিৰ্ভৰ কৰে। এটা স্পিকারৰ সৈতে পৰিষ্কাৰ অডিঅ'ত, আমাৰ সেৰা মডেলসমূহে ৬% ৰ তলৰ শব্দ ত্ৰুটিৰ হাৰ (WER) লাভ কৰে English -- মানৱ- স্তৰৰ সঠিকতাৰ ওচৰত ।

সৰ্বোত্তম ফলাফলৰ বাবে English অডিঅ', আমি সুপারিশ কৰোঁ:

  • অডিঅ' আঁতৰাওক -- পটভূমিৰ শব্দ হ্ৰাস কৰক আৰু ভাল মাইক্ৰফোন ব্যৱহাৰ কৰক
  • একক স্পিকার অংশ -- বহু- স্পিকার ৰেকৰ্ডিংৰ বাবে স্পিকার ডায়াৰাইজেশন সক্ৰিয় কৰক
  • সঠিক আৰ্হি বাছক -- NVIDIA Canary সমৰ্থিত ভাষাৰ বাবে সৰ্বনিম্ন WER প্ৰদান কৰে, Whisper Large V3 সর্ববৃহৎ ভাষাৰ আৱৰণ প্ৰদান কৰে
  • ভাষা নিৰ্ধাৰণ কৰক -- যদিও স্বচালিত-নিৰীক্ষণ ভালদৰে কাম কৰে, হস্তচালিতভাৱে নিৰ্বাচন কৰা English সঠিকতা কিছুটা উন্নত কৰিব পাৰে

ৰ বাবে এক্সপোৰ্ট বিন্যাস English অনুলিপি

আপোনাৰ English অডিঅ', এই বিন্যাসসমূহৰ যিকোনো এটাত ফলাফল ডাউনল'ড কৰক:

TXT
প্লেইন টেক্সট ট্রান্সক্ৰিপ্ট
SRT
সময়চিহ্ন সহ উপশীৰ্ষকসমূহ
VTT
ৱেব ভিডিঅ' উপশীৰ্ষকসমূহ
DOCX
Word দস্তাবেজ
JSON
সময়চিহ্নৰ সৈতে গঠনমূলক তথ্য
PDF
প্ৰিন্ট-প্ৰস্তুত দস্তাবেজ

প্ৰায়শঃ সোধা প্ৰশ্নসমূহ

STT.ai লে English (English) ধাৰণ কৰা এটা অডিঅ' অথবা ভিডিঅ' নথিপত্ৰ আপলোড কৰক অথবা এটা URL পেইস্ট কৰক। English সমৰ্থন কৰা এটা মডেল বাছক — সৰ্বোত্তম ফলাফলৰ বাবে উপৰ টেবুলত সৰ্বনিম্ন WER ৰ সৈতে এটা বাছক — আৰু অনুবাদ কৰক ক্লিক কৰক।

হ্যাঁ। STT.ai প্ৰত্যেক ভ্ৰমণকাৰীক 600 বিনামূলীয়া মিনিট / মাহ দিয়ক, যি English (1.5 billion বিশ্বব্যাপী কথোপকথনকাৰী) অন্তৰ্ভুক্ত কৰে। আপোনাৰ প্ৰথম ফাইলৰ বাবে কোনো নিবন্ধন প্ৰয়োজন নহয়। $5/মাহত আৰম্ভ হোৱা পৰিশোধিত পৰিকল্পনাসমূহে দীঘল ফাইল আৰু ব্যক্তিগত অনুলিপিসমূহ আনলক কৰে।

English সঠিকতা আমাৰ সেউজীয়া মডেলসমূহৰ সৈতে 93-96% পৰিষ্কাৰ অডিঅ'ত পৌঁছে। সংখ্যা, সঠিক নাৰ্ভ, আৰু inflected গঠন সকলো হ্যান্ডেল কৰা হয়। নিম্নতম পটভূমিৰ ধুমুহা সহ সুস্পষ্ট অডিঅ'য়ে সৰ্বোত্তম ফলাফল প্ৰদান কৰে।

English ৰ বাবে WER দ্বাৰা সমৰ্থিত মডেলসমূহৰ ওপৰত উল্লিখিত টেবুলত স্থান প্ৰদান কৰা হৈছে (নিম্নতম ভাল)। Whisper Large V3 ৰ সমৰ্থিত English ৰ আৱৰণ সৰ্বাধিক; NVIDIA Canary ৰ সমৰ্থিত English ৰ বৈচিত্রসমূহত সৰ্বনিম্ন WER আছে; STT.ai Enhanced এ দুইটোকে পেইড প্লানসমূহৰ বাবে একত্ৰিত কৰে।

হ'ব। English আউটপুটত বিৰাম-চিহ্ন (বিন্দু, কমা, প্ৰশ্নচিহ্ন) আৰু সঠিক কেছেং অন্তৰ্ভুক্ত আছে। সংখ্যা আৰু শিৰোনাম English নিয়ম অনুসৰণ কৰে। অনুবাদ সম্পাদকে বিৰাম-চিহ্ন হস্তচালিতভাৱে পৰিবৰ্তন কৰিব পাৰে।

হ্যাঁ। স্পিকার ডায়াৰাইজেশন ভাষা-অজ্ঞাত আৰু ইংৰাজীত কৰা দৰেই English ত কাম কৰে। প্ৰতিজন স্পিকারৰ লেবেল কৰা হয় (স্পিকার ১, স্পিকার ২,...) আৰু আপুনি প্ৰিন্টাৰত প্ৰিন্ট কৰাৰ পিছত তেওঁলোকক পুনৰ নাম দিব পাৰিব।

অধিকাংশ English নথিপত্ৰ ৫ মিনিটত অনুবাদ কৰা হয়। ১ ঘণ্টাৰ English অডিঅ' নথিপত্ৰ প্ৰায় ২-৩ মিনিট সময় লয় আমাৰ দ্রুততম মডেলসমূহৰ সৈতে, আৰু উচ্চতম-সঠিকতা মডেলসমূহৰ সৈতে কিছু সময় অধিক সময় লয়।

MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI আৰু ১০+ অন্যান্য বিন্যাসত ৮৮০০০ নথিপত্ৰ সকলো কাম কৰে। TXT, SRT, VTT, DOCX, JSON আৰু PDF ৰ পৰা আউটপুট - সকলো English টেক্সট অক্ষত।

হ'ব। English অডিঅ' নথিপত্ৰসমূহ অবিকল্পিতভাৱে প্ৰক্ৰিয়া কৰা হয় আৰু আঁতৰুৱা হয়। প্ৰো প্লানসমূহে ক্লায়েন্ট-সাইড এনক্ৰিপশন যোগ কৰে - আমাৰ ডাটাবেইচ যদিও ভাঙি যায়, আপোনাৰ কি'ৰ বাহিৰে আপোনাৰ ট্ৰান্সক্ৰিপ্টসমূহ পঢ়িব নোৱাৰি। English তথ্যক স্পষ্টভাবে অ'প-ইন নোহোৱাকৈ মডেল প্ৰশিক্ষণৰ বাবে কখনো ব্যৱহাৰ কৰা নহয়।

হ'ব। SRT অথবা VTT ৰূপে অনুবাদ এক্সপোৰ্ট কৰক - দুয়োটা YouTube, Vimeo, TikTok, আৰু সকলো প্ৰধান ভিডিঅ' প্লেটফৰ্মৰ সৈতে কাম কৰে। বাৰ্ন-সাবটাইটেল টুল দ্বাৰা ভিডিঅ'ত হার্ডসাব-ৰূপে অভাৰলে'ড কৰা হয়।

হ'ব। English অনুবাদ কৰাৰ পিছত, উপশীৰ্ষক-অনুবাদক টুল দ্বাৰা SRT/VTT-ক ১০০+ টার্গেট ভাষালৈ অনুবাদ কৰা যাব। আপোনাৰ English বিষয়বস্তুৰ বাবে অধিক দর্শকৰ বাবে উপশীৰ্ষকৰ প্ৰয়োজন হলে ব্যৱহাৰযোগ্য।

হ'ব। REST API-এ ভাষা প্ৰাচলৰ দ্বাৰা English সমৰ্থন কৰে (স্বয়ংক্ৰিয়ভাবে চিনাক্ত কৰাও উপলব্ধ)। Python আৰু Node.js SDK-এ আপুনি সম্পূৰ্ণ সময়চিহ্ন আৰু স্পিকার লেবেলৰ সৈতে English অডিঅ' ব্যাচ-ট্ৰান্সক্ৰিপ্ট কৰিব পাৰে।

English ৰ বাবে, সঠিকতাৰ সৰ্ববৃহৎ চলকসমূহ হৈছে পটভূমিৰ শব্দ, অদল-বদল স্পিকারসমূহ, আৰু উচ্চাৰণ শক্তি। এটা ভাল মাইক্রোফোন ব্যৱহাৰ কৰক, সম্ভৱ হলে পৃথক স্পিকারসমূহ, আৰু এটা মডেল বাছক যিটোক প্ৰয়োগযোগ্য উপভাষাত প্ৰশিক্ষণ দিয়া হৈছে।