ইংরেজি বক্তৃতা থেকে টেক্সট

রূপান্তর ইংরেজি (English) অডিও থেকে টেক্সট, state-of-the-art AI বাক সনাক্তকরণ সহ। দ্রুত, সঠিক, এবং একাধিক অডিও এবং ভিডিও ফরম্যাট সমর্থন করে।

পাবলিকভাবে উপলব্ধ অডিও এবং ভিডিও সহযোগে কাজ করে। DRM-প্রতিরক্ষাপ্রাপ্ত বিষয়বস্তু সমর্থিত নয়।

উন্নত করার জন্য উন্নত করুন

ব্যক্তিগত ট্রান্সক্রিপশন

ট্রান্সক্রিপশনের সাথে আড্ডা

Pro-র সাথে আনলক করুন →

ফাইল এখানে ফেলে দিন অথবা ব্রাউজ করতে ক্লিক করুন

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — ২GB পর্যন্ত

একাধিক ফাইল আপলোড করা হবে প্রফেশনাল

উন্নত করার জন্য উন্নত করুন

ব্যক্তিগত ট্রান্সক্রিপশন

ট্রান্সক্রিপশনের সাথে আড্ডা

Pro-র সাথে আনলক করুন →

উন্নত করার জন্য উন্নত করুন

বাস্তব সময়ের বাক্যের টেক্সট। আপনি কথা বললে AI স্বয়ংক্রিয়ভাবে সংশোধন করে - দীর্ঘ কথা বলার সাথে সাথে সঠিকতা উন্নত হয়।

প্রথমে মাইক্রোফোন পরীক্ষা করুন

১০ মুক্ত মিনিট/দিন 600 মিনিট বিনামূল্যে সাইন আপ ক্রেডিট কার্ড নেই এনক্রিপ্ট করা

বিনামূল্যে নিবন্ধন করুন →

সেরা মডেল ইংরেজি

মডেল	প্রদানকারী	WER
STT.ai Enhanced সেরা	STT.ai	3.2%	চেষ্টা করো
Whisper Large V3	OpenAI	4.2%	চেষ্টা করো
Whisper Turbo	OpenAI	5.1%	চেষ্টা করো
NVIDIA Canary	NVIDIA	3.5%	চেষ্টা করো
Moonshine	Useful Sensors	7.8%	চেষ্টা করো
NVIDIA Parakeet	NVIDIA	3.0%	চেষ্টা করো
SenseVoice	FunAudioLLM	5.5%	চেষ্টা করো
Distil-Whisper	Hugging Face	5.8%	চেষ্টা করো
Vosk	Alpha Cephei	12.0%	চেষ্টা করো

পরিচিতি ইংরেজি অনুবাদ

English is the most widely spoken language globally and the dominant language for business, technology, and international communication. STT.ai provides industry-leading English speech recognition across all major accents including American, British, Australian, and Indian English.

এসটিটি. আই. আধুনিক প্রযুক্তির সাহায্যে তথ্য প্রদান করে। ইংরেজি বহু AI মডেল দ্বারা চালিত শব্দ সনাক্তকরণ। আপনি যদি সাক্ষাৎকার, বক্তৃতা, পডকাস্ট, অথবা সভাগুলি অনুবাদ করতে চান ইংরেজিআমাদের প্ল্যাটফর্ম স্বয়ংক্রিয়ভাবে ভাষা সনাক্ত করে এবং সবচেয়ে সঠিক মডেল বেছে নেয়।

কতটা সঠিক ইংরেজি অনুবাদ?

এর জন্য সঠিকতা ইংরেজি অনুবাদ নির্ভর করে অডিও গুণমান, স্পিকার স্পষ্টতা, পটভূমির শব্দ এবং আপনি যে মডেলটি বেছে নিচ্ছেন তার ওপর। একটি স্পিকারের সাথে পরিষ্কার অডিওতে, আমাদের সেরা মডেলগুলির জন্য শব্দের ভুল হার (WER) ৬% এর নিচে। ইংরেজি -- মানব-স্তরের সঠিকতার কাছাকাছি।

সবচেয়ে ভালো ফলাফল পেতে ইংরেজি অডিও, আমরা পরামর্শ দিই:

অডিও মুছে ফেলুন -- পটভূমির শব্দ কমিয়ে আনো এবং ভাল মাইক্রোফোন ব্যবহার করো
একক স্পিকার অংশ -- মাল্টি- স্পিকার রেকর্ডিংয়ের জন্য স্পিকার ডায়ারি সক্রিয় করো
সঠিক মডেল বেছে নিন -- এনভিডিএ ক্যানারি সমর্থিত ভাষার জন্য সর্বনিম্ন WER প্রদান করে, যখন উইস্পার লম্বা V3 সর্ববৃহৎ ভাষার পরিধি প্রদান করে
ভাষা উল্লেখ করুন -- যখন স্বয়ংক্রিয়ভাবে সনাক্ত করা ভাল কাজ করে, তখন নিজে হাতে নির্বাচন করা ইংরেজি সঠিকতা সামান্য উন্নত করতে পারে

রপ্তানি ফরম্যাট ইংরেজি ট্রান্সক্রিপশন

আপনার অনুলিপি করার পরে ইংরেজি অডিও, ফলাফল ডাউনলোড করুন এই ফরম্যাটের যেকোন একটিতে:

TXT

প্লেইন টেক্সট ট্রান্সক্রিপশন

SRT

সময়সূচী সহ সাবটাইটেল

VTT

ওয়েব ভিডিও শিরোনাম

DOCX

ওয়ার্ড নথি

JSON

টাইমসটাম্প সহ গঠনমূলক তথ্য

PDF

মুদ্রণযোগ্য নথি

প্রায়শই জিজ্ঞাসিত প্রশ্ন

STT.ai-এ একটি অডিও অথবা ভিডিও ফাইল আপলোড করুন যাতে ইংরেজি (English) থাকে অথবা একটি ইউআরএল সাঁটান। একটি মডেল নির্বাচন করুন যা ইংরেজি সমর্থন করে - সর্বোত্তম ফলাফল পেতে উপরের টেবিলের নিম্নতম WER-এর সাথে একটি নির্বাচন করুন - এবং অনুবাদ করুন ক্লিক করুন।

Yes. STT.ai gives every visitor 600 free minutes/month, which includes ইংরেজি (1.5 billion speakers worldwide). No signup required for your first file. Paid plans starting at $5/month unlock longer files and private transcripts.

ইংরেজি সঠিকতা পরিষ্কার অডিও আমাদের সেরা মডেল 93-96% পৌঁছেছে। সংখ্যা, সঠিক নাম, এবং inflected ফর্ম সবসময় পরিচালিত হয়। পরিষ্কার অডিও সঙ্গে কম পটভূমির ঝামেলা সবচেয়ে ভাল ফলাফল উৎপাদন করে।

উপরের টেবিলটি WER দ্বারা ইংরেজি এর জন্য সমর্থিত মডেলগুলির ক্রম (নিম্নতরটি ভাল)। Whisper Large V3 এর সবচেয়ে বড় ইংরেজি কভারেজ রয়েছে; NVIDIA Canary এর সমর্থিত ইংরেজি বৈচিত্র্যগুলির সর্বনিম্ন WER রয়েছে; STT.ai Enhanced দুইটিই পে-প্ল্যানের জন্য একত্রিত করে।

হ্যাঁ । ৮৮০০০ আউটপুট ভিন্নতা (বিন্দু, কমন, প্রশ্ন চিহ্ন) এবং সঠিক ক্যাসেজ অন্তর্ভুক্ত করে । সংখ্যা এবং শিরোনাম ৮৮০০০ কনভেনশন অনুসরণ করে । ট্রান্সক্রিপ্ট সম্পাদক আপনাকে নিজে হাতে ভিন্নতা পরিবর্তন করতে দেয় ।

হ্যাঁ । স্পিকার ডায়ারিজম ভাষা- অজ্ঞাত এবং ৮৮০০০- এ কাজ করে যেমনটা ইংরেজিতে করে । প্রত্যেক স্পিকারের লেবেল থাকে (স্পিকার ১, স্পিকার ২,...) এবং আপনি তাদের নাম পরিবর্তন করতে পারেন সম্পাদকে অনুবাদ করার পরে ।

বেশিরভাগ ৮৮০০০ ফাইল ৫ মিনিটের মধ্যে অনুবাদ করা হয়। ১ ঘণ্টার ৮৮০০০ অডিও ফাইল সাধারণত আমাদের দ্রুততম মডেলগুলির সাথে ২-৩ মিনিট সময় নেয়, এবং উচ্চ-সঠিক মডেলগুলির সাথে সামান্য বেশি সময় নেয়।

MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI এবং ১০+ অন্যান্য ফরম্যাটের ৮৮০০০ ফাইল সমস্ত কাজ করে। আউটপুট TXT, SRT, VTT, DOCX, JSON এবং PDF-এ - সবগুলোই ৮৮০০০ টেক্সট অক্ষত।

হ্যাঁ। ৮৮০০০ অডিও ফাইল ডিফল্টভাবে প্রসেস এবং মুছে ফেলা হয়। প্রফেশনাল প্লান ক্লায়েন্ট-সাইড এনক্রিপশন যোগ করে - এমনকি যদি আমাদের ডাটাবেস ভেঙ্গে যায়, আপনার কী ছাড়া আপনার ট্রান্সক্রিপশন পড়া যাবে না। স্পষ্টভাবে অটো-ইন না করে কখনো ৮৮০০০ তথ্য মডেল প্রশিক্ষণের জন্য ব্যবহার করা হয় না।

হ্যাঁ। ট্রান্সক্রিপ্টটি SRT অথবা VTT হিসাবে রপ্তানি করুন - উভয়ই ইউটিউব, ভিমিও, টিকটক এবং সব প্রধান ভিডিও প্ল্যাটফর্মের সাথে কাজ করে। সাবটাইটেল টুলটি ভিডিওতে হার্ডসাব হিসাবে ওভারলে করে।

হ্যাঁ। ৮৮০০০ অনুবাদ করার পর, সাবটাইটেল-অনুবাদক টুল SRT/VTT-কে ১০০+ লক্ষ্য ভাষার যেকোন একটিতে অনুবাদ করতে পারে। আপনার ৮৮০০০ বিষয়বস্তুর জন্য যদি একটি বড় দর্শকগোষ্ঠীর জন্য সাবটাইটেল প্রয়োজন হয় তবে এটি ব্যবহারযোগ্য।

হ্যাঁ। REST API ভাষা পরামিতি ব্যবহার করে ইংরেজি সমর্থন করে (স্বয়ংক্রিয়ভাবে সনাক্ত করাও সম্ভব)। Python এবং Node.js SDKs আপনাকে পূর্ণ সময়সূচী এবং স্পিকার লেবেল সহ ইংরেজি অডিও ব্যাচ-ট্রানস্ক্রাইব করতে দেয়।

ইংরেজি এর জন্য, সবচেয়ে বড় সঠিকতা ভেরিয়েবল হল পটভূমির শব্দ, স্পিকারের ওভারল্যাপ এবং উচ্চারণ শক্তি। একটি ভাল মাইক্রোফোন ব্যবহার করুন, সম্ভব হলে আলাদা স্পিকার ব্যবহার করুন এবং একটি মডেল বেছে নিন যা উপযুক্ত উপভাষায় প্রশিক্ষিত।

ইংরেজি বক্তৃতা থেকে টেক্সট

সেরা মডেল ইংরেজি

পরিচিতি ইংরেজি অনুবাদ

কতটা সঠিক ইংরেজি অনুবাদ?

রপ্তানি ফরম্যাট ইংরেজি ট্রান্সক্রিপশন

প্রায়শই জিজ্ঞাসিত প্রশ্ন

আমি কিভাবে ইংরেজি অডিও টেক্সট অনুবাদ করতে পারি?

ইংরেজি ট্রান্সক্রিপশন কি বিনামূল্যে?

ইংরেজি এর অনুবাদ কতটা সঠিক?

কোন AI মডেল ইংরেজি এর জন্য সেরা?

আমি কি ৮৮০০০ এর জন্য পয়েন্টিং এবং ক্যাসিং পেতে পারি?

স্পিকার ডায়ারাইজেশন কি ৮৮০০০ অডিওতে কাজ করে?

ইংরেজি এর ট্রান্সক্রিপশন কতক্ষণ লাগে?

ইংরেজি অডিও'র জন্য কোন ফাইল ফরম্যাট সমর্থিত?

আমার ৮৮০০০ অডিও ডাটা কি গোপনীয়?

আমি কি ৮৮০০০ সাবটাইটেল এবং শিরোনাম তৈরি করতে পারি?

আমি কি ৮৮,০০০ টি অনুবাদ অন্য ভাষায় অনুবাদ করতে পারি?

আমি কি ইংরেজি এর জন্য API ব্যবহার করতে পারি?

ইংরেজি এর অনুবাদ করার সময় সাধারণত কোন ধরনের সমস্যা দেখা যায়?