অনলাইনে মুক্তভাবে কথা থেকে লেখা

AI-চালিত অনুবাদ সহ বাক্যের টেক্সট রূপান্তর করুন। অডিও ফাইল আপলোড করুন, আপনার মাইক্রোফোন থেকে রেকর্ড করুন, অথবা একটি ইউআরএল পেস্ট করুন। ১০০+ ভাষা, ১০+ মডেল, ৯৮%+ সঠিকতা।

পাবলিকভাবে উপলব্ধ অডিও এবং ভিডিও সহযোগে কাজ করে। DRM-প্রতিরক্ষাপ্রাপ্ত বিষয়বস্তু সমর্থিত নয়।

উন্নত করার জন্য উন্নত করুন

ব্যক্তিগত ট্রান্সক্রিপশন

ট্রান্সক্রিপশনের সাথে আড্ডা

Pro-র সাথে আনলক করুন →

ফাইল এখানে ফেলে দিন অথবা ব্রাউজ করতে ক্লিক করুন

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — ২GB পর্যন্ত

একাধিক ফাইল আপলোড করা হবে প্রফেশনাল

উন্নত করার জন্য উন্নত করুন

ব্যক্তিগত ট্রান্সক্রিপশন

ট্রান্সক্রিপশনের সাথে আড্ডা

Pro-র সাথে আনলক করুন →

উন্নত করার জন্য উন্নত করুন

বাস্তব সময়ের বাক্যের টেক্সট। আপনি কথা বললে AI স্বয়ংক্রিয়ভাবে সংশোধন করে - দীর্ঘ কথা বলার সাথে সাথে সঠিকতা উন্নত হয়।

প্রথমে মাইক্রোফোন পরীক্ষা করুন

১০ মুক্ত মিনিট/দিন 600 মিনিট বিনামূল্যে সাইন আপ ক্রেডিট কার্ড নেই এনক্রিপ্ট করা

বিনামূল্যে নিবন্ধন করুন →

বাক্যের কাজ কিভাবে কাজ করে →

1. Upload Speech Recording

Upload an audio or video file, paste a URL, or record speech from your mic.

2. AI Converts Speech to Text

Choose from 10+ AI models. Speaker detection and language auto-detect included.

3. Export Your Transcript

Download in 6 formats. Share transcript links with audio playback.

Supported Speech Input Formats

MP3 WAV M4A FLAC OGG MP4 MKV MOV WebM AVI

Speech to Text Models

Choose the AI model that fits your needs — or let us pick the best one.

Speech to Text in 100+ Languages

English Spanish French German Japanese Arabic Hindi Portuguese Russian Korean সব ভাষা →

Speech to Text Use Cases

Ready to convert speech to text?

বিনামূল্যে শুরু করুন →

প্রায়শই জিজ্ঞাসিত প্রশ্ন

বাক্যের জন্য টেক্সট (এছাড়াও বলা হয় বাক্যের স্বীকৃতি বা ASR) স্বয়ংক্রিয়ভাবে লেখা শব্দে কথা বলা অডিও রূপান্তর করে। STT.ai একটি AI মডেল দ্বারা আপনার রেকর্ডিং চালায় যা অডিও শুনতে এবং টাইমসটেম্প এবং স্পিকার লেবেল সহ সম্পাদনযোগ্য টেক্সট আউটপুট করে - টাইপিং করার প্রয়োজন নেই।

An acoustic model maps the sound waveform to phonemes, then a language model assembles those into the most likely words and punctuation. STT.ai does this on GPU with models like Whisper Large V3 and NVIDIA Canary, so a one-hour recording is usually done in 2-3 minutes.

হ্যাঁ, প্রত্যেক ভিজিটর মাসিক ৬০০ মিনিট বিনামূল্যে পাবেন, আপনার প্রথম ফাইলের জন্য কোন নিবন্ধন প্রয়োজন হবে না। বিনামূল্যে পরিকল্পনা শুরু হয় $৫/মাস এবং দীর্ঘ ফাইল, ব্যক্তিগত ট্রান্সক্রিপশন এবং অগ্রাধিকার প্রসেসিং যোগ করে।

পরিষ্কার কথা বলার ক্ষেত্রে আমাদের সেরা মডেল ৯৫-৯৭% সঠিকতা অর্জন করে (বেঞ্চমার্কের উপর ৩-৫% শব্দ ভুলের হার)। পটভূমির শব্দ, ভারী উচ্চারণ, ক্রসট্যাকিং, অথবা কম বিটরেটের অডিও ব্যবহারের ফলে সঠিকতা কমে যায় - একটি ভালো মাইক্রোফোন এবং একটি নিরাপদ কক্ষ ব্যবহার করলে সবচেয়ে বড় পার্থক্য হয়।

হ্যাঁ। আপনার মাইক্রোফোনে কথা বলুন এবং STT.ai লাইভ-ট্রানস্ক্রাইপশন টুল ব্যবহার করে সরাসরি ট্রান্সক্রিপশন স্ট্রিম করবে। আপনি যদি কথা বলার সময় শব্দের পর শব্দ রেকর্ড করতে চান না, তাহলে আপনি ব্যাচ ট্রান্সক্রিপশনের জন্য একটি সম্পূর্ণ রেকর্ড আপলোড করতে পারেন।

STT.ai ১০০+ ভাষা স্বীকার করে এবং অধিকাংশ অডিওতে স্বয়ংক্রিয়ভাবে কথা বলা ভাষা সনাক্ত করে। আপনি স্বয়ংক্রিয়ভাবেও ভাষা নির্ধারণ করতে পারেন, এবং মিশ্রিত ভাষার রেকর্ডিং মধ্য-কলিপের মধ্যে পরিবর্তন করে পরিচালিত হয়।

হ্যাঁ । স্পিকার ডাইরাইজেশন প্রত্যেকটি শব্দের (স্পিকার ১, স্পিকার ২,...) লেবেল দেয় এবং আপনি এদের নাম পরিবর্তন করতে পারেন সম্পাদকে । এটি সমর্থিত সকল মডেল এবং ভাষায় কাজ করে ।

STT.ai MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, এবং AVI সহ ২০+ ফরম্যাট গ্রহণ করে। আউটপুট TXT, SRT, VTT, DOCX, JSON, অথবা PDF।

Speech to text transcribes WHAT was said into words; voice recognition (speaker identification) determines WHO said it. STT.ai does both — transcription plus speaker diarization — but the terms describe different tasks.

Yes. Audio is processed and deleted by default. Pro plans add client-side encryption so transcripts are unreadable without your key, even to STT.ai, and your data is never used for model training without explicit opt-in.

হ্যাঁ। STT.ai-এ পাইথন এবং Node.js SDKs সহ একটি REST API এবং Claude এবং Cursor-এর জন্য একটি MCP সার্ভার রয়েছে। বিনামূল্যে API স্তরটিতে ১০০ মিনিট/মাস অন্তর্ভুক্ত রয়েছে, যার বাইরে প্রতি সেকেন্ডে বিলিং করা হয়।

হ্যাঁ, প্রতিটি ট্রান্সক্রিপ্ট একটি অভ্যন্তরীণ সম্পাদকে খোলা হবে যেখানে আপনি ভুল শব্দ ঠিক করতে পারেন, স্পিকারের নাম পরিবর্তন করতে পারেন, সময়সূচী সংশোধন করতে পারেন এবং নোট যোগ করতে পারেন। সম্পাদনাগুলি প্রতিটি রপ্তানি ফরম্যাটে স্থায়ী থাকে।

অনলাইনে মুক্তভাবে কথা থেকে লেখা

1. Upload Speech Recording

2. AI Converts Speech to Text

3. Export Your Transcript

Supported Speech Input Formats

Speech to Text Models

Speech to Text in 100+ Languages

Speech to Text Use Cases

Ready to convert speech to text?

প্রায়শই জিজ্ঞাসিত প্রশ্ন

বাক্যের জন্য টেক্সট কি?

বাক্যের লেখা কিভাবে কাজ করে?

STT.ai স্পিকার টেক্সট কি বিনামূল্যে?

ভাষ্যের থেকে লেখার পরিবর্তিত হওয়ার সঠিকতা কতটুকু?

আমি কি বাস্তব সময়ে কথাকে টেক্সটে রূপান্তর করতে পারি?

কোন ভাষায় বাক্যের জন্য টেক্সট সমর্থন করে?

বাক্যের টেক্সট কি সনাক্ত করে কে কথা বলছে?

কোন অডিও এবং ভিডিও ফরম্যাট আমি টেক্সটে রূপান্তর করতে পারি?

বাক্যের মধ্যে বাক্যের ধারণ কি শব্দ সনাক্তকরণের সমান?

আমি টেক্সট-এ-ভাষা ব্যবহার করার সময় আমার অডিও কি গোপনীয় হবে?

ডেভেলপাররা কি এপিআই ব্যবহার করে টেক্সটে কথা যোগ করতে পারবেন?

বাক্যের পর আমি কি টেক্সট সম্পাদন করতে পারি?