English বক্তৃতা থেকে টেক্সট

Convert English (English) audio to text with AI. Fast, accurate, 10+ models.

পাবলিকভাবে উপলব্ধ অডিও এবং ভিডিও সহযোগে কাজ করে। DRM-প্রতিরক্ষাপ্রাপ্ত বিষয়বস্তু সমর্থিত নয়।

উন্নত করার জন্য উন্নত করুন
Private transcript
ট্রান্সক্রিপশনের সাথে আড্ডা
Pro-র সাথে আনলক করুন →
ফাইল এখানে ফেলে দিন অথবা ব্রাউজ করতে ক্লিক করুন
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — ২GB পর্যন্ত
উন্নত করার জন্য উন্নত করুন
Private transcript
ট্রান্সক্রিপশনের সাথে আড্ডা
Pro-র সাথে আনলক করুন →
উন্নত করার জন্য উন্নত করুন
রেকর্ডিং: 0:00
বাস্তব সময় মোম (অবিলম্বে)
উন্নত Whisper (সঠিক)
পাবলিক লিংক: ২৪ ঘণ্টা, শুধু টেক্সট · নিবন্ধন করুন 7d + অডিও জন্য · প্রফেশনাল ব্যক্তিগত লিঙ্কের জন্য

বাস্তব সময়ের বাক্যের টেক্সট। আপনি কথা বললে AI স্বয়ংক্রিয়ভাবে সংশোধন করে - দীর্ঘ কথা বলার সাথে সাথে সঠিকতা উন্নত হয়।

প্রথমে মাইক্রোফোন পরীক্ষা করুন
❤️ STT.ai পছন্দ করেন? আপনার বন্ধুদের বলুন!
তুমি তোমার ফ্রি ট্রান্সক্রিপশন ব্যবহার করেছ

বিনামূল্যে ৬০০ মিনিট/মাস পেতে নিবন্ধন করুন, অথবা অসীমিত ট্রান্সক্রিপশনের জন্য আপগ্রেড করুন।

১০ মুক্ত মিনিট/দিন 600 মিনিট বিনামূল্যে সাইন আপ ক্রেডিট কার্ড নেই এনক্রিপ্ট করা
বিনামূল্যে নিবন্ধন করুন →

Best Models for English

Model Provider WER Speed
STT.ai Enhanced Best STT.ai 3.2% Try it
Whisper Large V3 OpenAI 4.2% Try it
Whisper Turbo OpenAI 5.1% Try it
NVIDIA Canary NVIDIA 3.5% Try it
Moonshine Useful Sensors 7.8% Try it
NVIDIA Parakeet NVIDIA 3.0% Try it
SenseVoice FunAudioLLM 5.5% Try it
Distil-Whisper Hugging Face 5.8% Try it
Vosk Alpha Cephei 12.0% Try it

পরিচিতি English ট্রান্সক্রিপশন

English is the most widely spoken language globally and the dominant language for business, technology, and international communication. STT.ai provides industry-leading English speech recognition across all major accents including American, British, Australian, and Indian English.

এসটিটি. আই. আধুনিক প্রযুক্তির সাহায্যে তথ্য প্রদান করে। English বহু AI মডেল দ্বারা চালিত শব্দ সনাক্তকরণ। আপনি যদি সাক্ষাৎকার, বক্তৃতা, পডকাস্ট, অথবা সভাগুলি অনুবাদ করতে চান Englishআমাদের প্ল্যাটফর্ম স্বয়ংক্রিয়ভাবে ভাষা সনাক্ত করে এবং সবচেয়ে সঠিক মডেল বেছে নেয়।

কতটা সঠিক English অনুবাদ?

এর জন্য সঠিকতা English অনুবাদ নির্ভর করে অডিও গুণমান, স্পিকার স্পষ্টতা, পটভূমির শব্দ এবং আপনি যে মডেলটি বেছে নিচ্ছেন তার ওপর। একটি স্পিকারের সাথে পরিষ্কার অডিওতে, আমাদের সেরা মডেলগুলির জন্য শব্দের ভুল হার (WER) ৬% এর নিচে। English -- মানব-স্তরের সঠিকতার কাছাকাছি।

সবচেয়ে ভালো ফলাফল পেতে English অডিও, আমরা পরামর্শ দিই:

  • অডিও মুছে ফেলুন -- পটভূমির শব্দ কমিয়ে আনো এবং ভাল মাইক্রোফোন ব্যবহার করো
  • একক স্পিকার অংশ -- মাল্টি- স্পিকার রেকর্ডিংয়ের জন্য স্পিকার ডায়ারি সক্রিয় করো
  • সঠিক মডেল বেছে নিন -- এনভিডিএ ক্যানারি সমর্থিত ভাষার জন্য সর্বনিম্ন WER প্রদান করে, যখন উইস্পার লম্বা V3 সর্ববৃহৎ ভাষার পরিধি প্রদান করে
  • ভাষা উল্লেখ করুন -- যখন স্বয়ংক্রিয়ভাবে সনাক্ত করা ভাল কাজ করে, তখন নিজে হাতে নির্বাচন করা English সঠিকতা সামান্য উন্নত করতে পারে

রপ্তানি ফরম্যাট English ট্রান্সক্রিপশন

আপনার অনুলিপি করার পরে English অডিও, ফলাফল ডাউনলোড করুন এই ফরম্যাটের যেকোন একটিতে:

TXT
প্লেইন টেক্সট ট্রান্সক্রিপশন
SRT
সময়সূচী সহ সাবটাইটেল
VTT
ওয়েব ভিডিও শিরোনাম
DOCX
ওয়ার্ড নথি
JSON
টাইমসটাম্প সহ গঠনমূলক তথ্য
PDF
মুদ্রণযোগ্য নথি

প্রায়শই জিজ্ঞাসিত প্রশ্ন

STT.ai-এ একটি অডিও অথবা ভিডিও ফাইল আপলোড করুন যাতে English (English) থাকে অথবা একটি ইউআরএল সাঁটান। একটি মডেল নির্বাচন করুন যা English সমর্থন করে - সর্বোত্তম ফলাফল পেতে উপরের টেবিলের নিম্নতম WER-এর সাথে একটি নির্বাচন করুন - এবং অনুবাদ করুন ক্লিক করুন।

Yes. STT.ai gives every visitor 600 free minutes/month, which includes English (1.5 billion speakers worldwide). No signup required for your first file. Paid plans starting at $5/month unlock longer files and private transcripts.

English সঠিকতা পরিষ্কার অডিও আমাদের সেরা মডেল 93-96% পৌঁছেছে। সংখ্যা, সঠিক নাম, এবং inflected ফর্ম সবসময় পরিচালিত হয়। পরিষ্কার অডিও সঙ্গে কম পটভূমির ঝামেলা সবচেয়ে ভাল ফলাফল উৎপাদন করে।

উপরের টেবিলটি WER দ্বারা English এর জন্য সমর্থিত মডেলগুলির ক্রম (নিম্নতরটি ভাল)। Whisper Large V3 এর সবচেয়ে বড় English কভারেজ রয়েছে; NVIDIA Canary এর সমর্থিত English বৈচিত্র্যগুলির সর্বনিম্ন WER রয়েছে; STT.ai Enhanced দুইটিই পে-প্ল্যানের জন্য একত্রিত করে।

হ্যাঁ । ৮৮০০০ আউটপুট ভিন্নতা (বিন্দু, কমন, প্রশ্ন চিহ্ন) এবং সঠিক ক্যাসেজ অন্তর্ভুক্ত করে । সংখ্যা এবং শিরোনাম ৮৮০০০ কনভেনশন অনুসরণ করে । ট্রান্সক্রিপ্ট সম্পাদক আপনাকে নিজে হাতে ভিন্নতা পরিবর্তন করতে দেয় ।

হ্যাঁ । স্পিকার ডায়ারিজম ভাষা- অজ্ঞাত এবং ৮৮০০০- এ কাজ করে যেমনটা ইংরেজিতে করে । প্রত্যেক স্পিকারের লেবেল থাকে (স্পিকার ১, স্পিকার ২,...) এবং আপনি তাদের নাম পরিবর্তন করতে পারেন সম্পাদকে অনুবাদ করার পরে ।

বেশিরভাগ ৮৮০০০ ফাইল ৫ মিনিটের মধ্যে অনুবাদ করা হয়। ১ ঘণ্টার ৮৮০০০ অডিও ফাইল সাধারণত আমাদের দ্রুততম মডেলগুলির সাথে ২-৩ মিনিট সময় নেয়, এবং উচ্চ-সঠিক মডেলগুলির সাথে সামান্য বেশি সময় নেয়।

MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI এবং ১০+ অন্যান্য ফরম্যাটের ৮৮০০০ ফাইল সমস্ত কাজ করে। আউটপুট TXT, SRT, VTT, DOCX, JSON এবং PDF-এ - সবগুলোই ৮৮০০০ টেক্সট অক্ষত।

হ্যাঁ। ৮৮০০০ অডিও ফাইল ডিফল্টভাবে প্রসেস এবং মুছে ফেলা হয়। প্রফেশনাল প্লান ক্লায়েন্ট-সাইড এনক্রিপশন যোগ করে - এমনকি যদি আমাদের ডাটাবেস ভেঙ্গে যায়, আপনার কী ছাড়া আপনার ট্রান্সক্রিপশন পড়া যাবে না। স্পষ্টভাবে অটো-ইন না করে কখনো ৮৮০০০ তথ্য মডেল প্রশিক্ষণের জন্য ব্যবহার করা হয় না।

হ্যাঁ। ট্রান্সক্রিপ্টটি SRT অথবা VTT হিসাবে রপ্তানি করুন - উভয়ই ইউটিউব, ভিমিও, টিকটক এবং সব প্রধান ভিডিও প্ল্যাটফর্মের সাথে কাজ করে। সাবটাইটেল টুলটি ভিডিওতে হার্ডসাব হিসাবে ওভারলে করে।

হ্যাঁ। ৮৮০০০ অনুবাদ করার পর, সাবটাইটেল-অনুবাদক টুল SRT/VTT-কে ১০০+ লক্ষ্য ভাষার যেকোন একটিতে অনুবাদ করতে পারে। আপনার ৮৮০০০ বিষয়বস্তুর জন্য যদি একটি বড় দর্শকগোষ্ঠীর জন্য সাবটাইটেল প্রয়োজন হয় তবে এটি ব্যবহারযোগ্য।

হ্যাঁ। REST API ভাষা পরামিতি ব্যবহার করে English সমর্থন করে (স্বয়ংক্রিয়ভাবে সনাক্ত করাও সম্ভব)। Python এবং Node.js SDKs আপনাকে পূর্ণ সময়সূচী এবং স্পিকার লেবেল সহ English অডিও ব্যাচ-ট্রানস্ক্রাইব করতে দেয়।

English এর জন্য, সবচেয়ে বড় সঠিকতা ভেরিয়েবল হল পটভূমির শব্দ, স্পিকারের ওভারল্যাপ এবং উচ্চারণ শক্তি। একটি ভাল মাইক্রোফোন ব্যবহার করুন, সম্ভব হলে আলাদা স্পিকার ব্যবহার করুন এবং একটি মডেল বেছে নিন যা উপযুক্ত উপভাষায় প্রশিক্ষিত।