অনলাইনে মুক্তভাবে কথা থেকে লেখা

AI-চালিত অনুবাদ সহ বাক্যের টেক্সট রূপান্তর করুন। অডিও ফাইল আপলোড করুন, আপনার মাইক্রোফোন থেকে রেকর্ড করুন, অথবা একটি ইউআরএল পেস্ট করুন। ১০০+ ভাষা, ১০+ মডেল, ৯৮%+ সঠিকতা।

পাবলিকভাবে উপলব্ধ অডিও এবং ভিডিও সহযোগে কাজ করে। DRM-প্রতিরক্ষাপ্রাপ্ত বিষয়বস্তু সমর্থিত নয়।

উন্নত করার জন্য উন্নত করুন
ব্যক্তিগত ট্রান্সক্রিপশন
ট্রান্সক্রিপশনের সাথে আড্ডা
Pro-র সাথে আনলক করুন →
ফাইল এখানে ফেলে দিন অথবা ব্রাউজ করতে ক্লিক করুন
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — ২GB পর্যন্ত
উন্নত করার জন্য উন্নত করুন
ব্যক্তিগত ট্রান্সক্রিপশন
ট্রান্সক্রিপশনের সাথে আড্ডা
Pro-র সাথে আনলক করুন →
উন্নত করার জন্য উন্নত করুন
রেকর্ডিং: 0:00
বাস্তব সময় মোম (অবিলম্বে)
উন্নত Whisper (সঠিক)
পাবলিক লিংক: ২৪ ঘণ্টা, শুধু টেক্সট · নিবন্ধন করুন 7d + অডিও জন্য · প্রফেশনাল ব্যক্তিগত লিঙ্কের জন্য

বাস্তব সময়ের বাক্যের টেক্সট। আপনি কথা বললে AI স্বয়ংক্রিয়ভাবে সংশোধন করে - দীর্ঘ কথা বলার সাথে সাথে সঠিকতা উন্নত হয়।

প্রথমে মাইক্রোফোন পরীক্ষা করুন
❤️ STT.ai পছন্দ করেন? আপনার বন্ধুদের বলুন!
তুমি তোমার ফ্রি ট্রান্সক্রিপশন ব্যবহার করেছ

বিনামূল্যে ৬০০ মিনিট/মাস পেতে নিবন্ধন করুন, অথবা অসীমিত ট্রান্সক্রিপশনের জন্য আপগ্রেড করুন।

১০ মুক্ত মিনিট/দিন 600 মিনিট বিনামূল্যে সাইন আপ ক্রেডিট কার্ড নেই এনক্রিপ্ট করা
বিনামূল্যে নিবন্ধন করুন →

1. Upload Speech Recording

Upload an audio or video file, paste a URL, or record speech from your mic.

2. AI Converts Speech to Text

Choose from 10+ AI models. Speaker detection and language auto-detect included.

3. Export Your Transcript

Download in 6 formats. Share transcript links with audio playback.

Supported Speech Input Formats

প্রায়শই জিজ্ঞাসিত প্রশ্ন

বাক্যের জন্য টেক্সট (এছাড়াও বলা হয় বাক্যের স্বীকৃতি বা ASR) স্বয়ংক্রিয়ভাবে লেখা শব্দে কথা বলা অডিও রূপান্তর করে। STT.ai একটি AI মডেল দ্বারা আপনার রেকর্ডিং চালায় যা অডিও শুনতে এবং টাইমসটেম্প এবং স্পিকার লেবেল সহ সম্পাদনযোগ্য টেক্সট আউটপুট করে - টাইপিং করার প্রয়োজন নেই।

An acoustic model maps the sound waveform to phonemes, then a language model assembles those into the most likely words and punctuation. STT.ai does this on GPU with models like Whisper Large V3 and NVIDIA Canary, so a one-hour recording is usually done in 2-3 minutes.

হ্যাঁ, প্রত্যেক ভিজিটর মাসিক ৬০০ মিনিট বিনামূল্যে পাবেন, আপনার প্রথম ফাইলের জন্য কোন নিবন্ধন প্রয়োজন হবে না। বিনামূল্যে পরিকল্পনা শুরু হয় $৫/মাস এবং দীর্ঘ ফাইল, ব্যক্তিগত ট্রান্সক্রিপশন এবং অগ্রাধিকার প্রসেসিং যোগ করে।

পরিষ্কার কথা বলার ক্ষেত্রে আমাদের সেরা মডেল ৯৫-৯৭% সঠিকতা অর্জন করে (বেঞ্চমার্কের উপর ৩-৫% শব্দ ভুলের হার)। পটভূমির শব্দ, ভারী উচ্চারণ, ক্রসট্যাকিং, অথবা কম বিটরেটের অডিও ব্যবহারের ফলে সঠিকতা কমে যায় - একটি ভালো মাইক্রোফোন এবং একটি নিরাপদ কক্ষ ব্যবহার করলে সবচেয়ে বড় পার্থক্য হয়।

হ্যাঁ। আপনার মাইক্রোফোনে কথা বলুন এবং STT.ai লাইভ-ট্রানস্ক্রাইপশন টুল ব্যবহার করে সরাসরি ট্রান্সক্রিপশন স্ট্রিম করবে। আপনি যদি কথা বলার সময় শব্দের পর শব্দ রেকর্ড করতে চান না, তাহলে আপনি ব্যাচ ট্রান্সক্রিপশনের জন্য একটি সম্পূর্ণ রেকর্ড আপলোড করতে পারেন।

STT.ai ১০০+ ভাষা স্বীকার করে এবং অধিকাংশ অডিওতে স্বয়ংক্রিয়ভাবে কথা বলা ভাষা সনাক্ত করে। আপনি স্বয়ংক্রিয়ভাবেও ভাষা নির্ধারণ করতে পারেন, এবং মিশ্রিত ভাষার রেকর্ডিং মধ্য-কলিপের মধ্যে পরিবর্তন করে পরিচালিত হয়।

হ্যাঁ । স্পিকার ডাইরাইজেশন প্রত্যেকটি শব্দের (স্পিকার ১, স্পিকার ২,...) লেবেল দেয় এবং আপনি এদের নাম পরিবর্তন করতে পারেন সম্পাদকে । এটি সমর্থিত সকল মডেল এবং ভাষায় কাজ করে ।

STT.ai MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, এবং AVI সহ ২০+ ফরম্যাট গ্রহণ করে। আউটপুট TXT, SRT, VTT, DOCX, JSON, অথবা PDF।

Speech to text transcribes WHAT was said into words; voice recognition (speaker identification) determines WHO said it. STT.ai does both — transcription plus speaker diarization — but the terms describe different tasks.

Yes. Audio is processed and deleted by default. Pro plans add client-side encryption so transcripts are unreadable without your key, even to STT.ai, and your data is never used for model training without explicit opt-in.

হ্যাঁ। STT.ai-এ পাইথন এবং Node.js SDKs সহ একটি REST API এবং Claude এবং Cursor-এর জন্য একটি MCP সার্ভার রয়েছে। বিনামূল্যে API স্তরটিতে ১০০ মিনিট/মাস অন্তর্ভুক্ত রয়েছে, যার বাইরে প্রতি সেকেন্ডে বিলিং করা হয়।

হ্যাঁ, প্রতিটি ট্রান্সক্রিপ্ট একটি অভ্যন্তরীণ সম্পাদকে খোলা হবে যেখানে আপনি ভুল শব্দ ঠিক করতে পারেন, স্পিকারের নাম পরিবর্তন করতে পারেন, সময়সূচী সংশোধন করতে পারেন এবং নোট যোগ করতে পারেন। সম্পাদনাগুলি প্রতিটি রপ্তানি ফরম্যাটে স্থায়ী থাকে।