অনলাইনে মুক্তভাবে কথা থেকে লেখা
AI-চালিত অনুবাদ সহ বাক্যের টেক্সট রূপান্তর করুন। অডিও ফাইল আপলোড করুন, আপনার মাইক্রোফোন থেকে রেকর্ড করুন, অথবা একটি ইউআরএল পেস্ট করুন। ১০০+ ভাষা, ১০+ মডেল, ৯৮%+ সঠিকতা।
1. Upload Speech Recording
Upload an audio or video file, paste a URL, or record speech from your mic.
2. AI Converts Speech to Text
Choose from 10+ AI models. Speaker detection and language auto-detect included.
3. Export Your Transcript
Download in 6 formats. Share transcript links with audio playback.
Speech to Text Models
Choose the AI model that fits your needs — or let us pick the best one.
Speech to Text in 100+ Languages
Ready to convert speech to text?
বিনামূল্যে শুরু করুন →প্রায়শই জিজ্ঞাসিত প্রশ্ন
বাক্যের জন্য টেক্সট (এছাড়াও বলা হয় বাক্যের স্বীকৃতি বা ASR) স্বয়ংক্রিয়ভাবে লেখা শব্দে কথা বলা অডিও রূপান্তর করে। STT.ai একটি AI মডেল দ্বারা আপনার রেকর্ডিং চালায় যা অডিও শুনতে এবং টাইমসটেম্প এবং স্পিকার লেবেল সহ সম্পাদনযোগ্য টেক্সট আউটপুট করে - টাইপিং করার প্রয়োজন নেই।
An acoustic model maps the sound waveform to phonemes, then a language model assembles those into the most likely words and punctuation. STT.ai does this on GPU with models like Whisper Large V3 and NVIDIA Canary, so a one-hour recording is usually done in 2-3 minutes.
হ্যাঁ, প্রত্যেক ভিজিটর মাসিক ৬০০ মিনিট বিনামূল্যে পাবেন, আপনার প্রথম ফাইলের জন্য কোন নিবন্ধন প্রয়োজন হবে না। বিনামূল্যে পরিকল্পনা শুরু হয় $৫/মাস এবং দীর্ঘ ফাইল, ব্যক্তিগত ট্রান্সক্রিপশন এবং অগ্রাধিকার প্রসেসিং যোগ করে।
পরিষ্কার কথা বলার ক্ষেত্রে আমাদের সেরা মডেল ৯৫-৯৭% সঠিকতা অর্জন করে (বেঞ্চমার্কের উপর ৩-৫% শব্দ ভুলের হার)। পটভূমির শব্দ, ভারী উচ্চারণ, ক্রসট্যাকিং, অথবা কম বিটরেটের অডিও ব্যবহারের ফলে সঠিকতা কমে যায় - একটি ভালো মাইক্রোফোন এবং একটি নিরাপদ কক্ষ ব্যবহার করলে সবচেয়ে বড় পার্থক্য হয়।
হ্যাঁ। আপনার মাইক্রোফোনে কথা বলুন এবং STT.ai লাইভ-ট্রানস্ক্রাইপশন টুল ব্যবহার করে সরাসরি ট্রান্সক্রিপশন স্ট্রিম করবে। আপনি যদি কথা বলার সময় শব্দের পর শব্দ রেকর্ড করতে চান না, তাহলে আপনি ব্যাচ ট্রান্সক্রিপশনের জন্য একটি সম্পূর্ণ রেকর্ড আপলোড করতে পারেন।
STT.ai ১০০+ ভাষা স্বীকার করে এবং অধিকাংশ অডিওতে স্বয়ংক্রিয়ভাবে কথা বলা ভাষা সনাক্ত করে। আপনি স্বয়ংক্রিয়ভাবেও ভাষা নির্ধারণ করতে পারেন, এবং মিশ্রিত ভাষার রেকর্ডিং মধ্য-কলিপের মধ্যে পরিবর্তন করে পরিচালিত হয়।
হ্যাঁ । স্পিকার ডাইরাইজেশন প্রত্যেকটি শব্দের (স্পিকার ১, স্পিকার ২,...) লেবেল দেয় এবং আপনি এদের নাম পরিবর্তন করতে পারেন সম্পাদকে । এটি সমর্থিত সকল মডেল এবং ভাষায় কাজ করে ।
STT.ai MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, এবং AVI সহ ২০+ ফরম্যাট গ্রহণ করে। আউটপুট TXT, SRT, VTT, DOCX, JSON, অথবা PDF।
Speech to text transcribes WHAT was said into words; voice recognition (speaker identification) determines WHO said it. STT.ai does both — transcription plus speaker diarization — but the terms describe different tasks.
Yes. Audio is processed and deleted by default. Pro plans add client-side encryption so transcripts are unreadable without your key, even to STT.ai, and your data is never used for model training without explicit opt-in.
হ্যাঁ। STT.ai-এ পাইথন এবং Node.js SDKs সহ একটি REST API এবং Claude এবং Cursor-এর জন্য একটি MCP সার্ভার রয়েছে। বিনামূল্যে API স্তরটিতে ১০০ মিনিট/মাস অন্তর্ভুক্ত রয়েছে, যার বাইরে প্রতি সেকেন্ডে বিলিং করা হয়।
হ্যাঁ, প্রতিটি ট্রান্সক্রিপ্ট একটি অভ্যন্তরীণ সম্পাদকে খোলা হবে যেখানে আপনি ভুল শব্দ ঠিক করতে পারেন, স্পিকারের নাম পরিবর্তন করতে পারেন, সময়সূচী সংশোধন করতে পারেন এবং নোট যোগ করতে পারেন। সম্পাদনাগুলি প্রতিটি রপ্তানি ফরম্যাটে স্থায়ী থাকে।