মুক্ত কথন টেক্সট অনলাইন
AI-চালিত অনুবাদৰ সৈতে কথাক টেক্সটলৈ পৰিবৰ্তন কৰক। অডিঅ' ফাইল আপলোড কৰক, আপোনাৰ মাইক্রোফোনৰ পৰা ৰেকৰ্ড কৰক, অথবা এটা URL পেইস্ট কৰক। ১০০+ ভাষা, ১০+ মডেল, ৯৮%+ সঠিকতা।
1. কথাৰ ৰেকৰ্ড আপলোড কৰক
অডিঅ' অথবা ভিডিঅ' নথিপত্ৰ আপলোড কৰক, URL পেইস্ট কৰক, অথবা মাইক ব্যৱহাৰ কৰি কথা ৰেকৰ্ড কৰক।
২. AIয়ে কথাক লিখনীলৈ ৰূপান্তৰ কৰে
১০+ AI মডেলসমূহৰ পৰা বাছক। স্পিকার চিনাক্তকৰণ আৰু ভাষা স্বয়ংক্ৰিয়ভাবে চিনাক্তকৰণ অন্তৰ্ভুক্ত।
3. আপোনাৰ অনুলিপি এক্সপোৰ্ট কৰক
৬ বিন্যাসত ডাউনলোড কৰক। অডিঅ' প্লেব্যাকৰ সৈতে অনুবাদ লিঙ্কসমূহ ভাগ কৰক।
কথাৰ পৰা লিপিলৈ মডেলসমূহ
আপোনাৰ প্ৰয়োজন অনুসৰি AI মডেল বাচি লওক – অথবা আমাক সৰ্বোত্তমটো বাচি ল’বলৈ দিয়ক।
১০০+ ভাষাত শব্দক টেক্সটলৈ পৰিবৰ্তন কৰক
কথাক লিপিলৈ ৰূপান্তৰ কৰিবলৈ প্ৰস্তুত নে?
মুক্ত আৰম্ভ কৰক →প্ৰায়শঃ সোধা প্ৰশ্নসমূহ
কথাৰ পৰা লিখনীলৈ (ভাষা স্বীকৃতি বা ASR বুলিও কোৱা হয়) স্বয়ংক্ৰিয়ভাৱে কোৱা অডিঅ'ক লিখিত শব্দলৈ পৰিবৰ্তন কৰে। STT.ai এ আপোনাৰ ৰেকৰ্ডিংক এটা AI মডেল দ্বাৰা চলায় যি অডিঅ'ক শুনি আৰু সময়চিহ্ন আৰু কথোপকথন লেবেল সহ সম্পাদনযোগ্য টেক্সট আউটপুট কৰে - টাইপ কৰাৰ প্ৰয়োজন নাই।
এটা শব্দগত মডেলে শব্দৰ তৰংগৰূপক শব্দৰ ৰূপত মেপ কৰে, তাৰ পিছত এটা ভাষাগত মডেলে সেইবোৰক সৰ্বাধিক সম্ভৱ শব্দ আৰু বিৰাম-চিহ্নলৈ সংগ্ৰহ কৰে। STT.ai এ Whisper Large V3 আৰু NVIDIA Canary ৰ দৰে মডেলসমূহৰ সৈতে GPU ত এইটো কৰে, গতিকে এটা ঘন্টাৰ ৰেকৰ্ডিং সাধাৰণতে ২-৩ মিনিটত কৰা হয়।
হ'ব। প্ৰতিজন ভ্ৰমণকাৰীয়ে আপোনাৰ প্ৰথম নথিপত্ৰৰ বাবে কোনো নিবন্ধন অবিহনে প্ৰতি মাহে ৬০০ বিনামূলীয়া মিনিট লাভ কৰে। বিনিময়মূল্যযুক্ত পৰিকল্পনাসমূহ $৫/মাহত আৰম্ভ হয় আৰু দীঘল ফাইলসমূহ, ব্যক্তিগত অনুলিপিসমূহ আৰু অগ্ৰাধিকাৰ প্ৰক্ৰিয়াকৰণ যোগ কৰে।
সুস্থ কথাত আমাৰ সেউজীয়া মডেলসমূহে ৯৫-৯৭% সঠিকতাত উপনীত হয় (বেঞ্চমাৰ্কত ৩-৫% শব্দ ত্ৰুটিৰ হাৰ)। পটভূমিৰ শব্দ, ভাৰী উচ্চাৰণ, ক্ৰচট্যালক, বা কম-বিটৰেট অডিঅ'ৰ সৈতে সঠিকতা হ্ৰাস পায়—এটা ভাল মাইক্ৰফোন আৰু এটা শান্ত কক্ষ ব্যৱহাৰ কৰি সৰ্বাধিক পাৰ্থক্য ঘটায়।
হ্যাঁ। আপোনাৰ মাইক্রোফোনত কথা কওক আৰু STT.ai ষ্ট্ৰিমসমূহে লাইভ-ট্ৰান্সক্ৰিপচন টুল ব্যৱহাৰ কৰি ট্ৰান্সক্ৰিপ্ট সরাসৰি প্ৰদৰ্শন কৰিব। আপুনি যদি কথা কওঁতে শব্দ-বিশব্দে ট্ৰান্সক্ৰিপ্টৰ প্ৰয়োজন নাই তেন্তে ব্যাচ ট্ৰান্সক্ৰিপ্টৰ বাবে এটা সম্পূৰ্ণ ৰেকৰ্ড আপলোড কৰিব পাৰে।
STT.ai এ ১০০+ ভাষা চিনাক্ত কৰে আৰু অধিকাংশ অডিঅ'ৰ বাবে কথ্য ভাষা স্বয়ংক্ৰিয়ভাৱে চিনাক্ত কৰে। আপুনি সঠিকতাৰ সৰু লিফটৰ বাবে ভাষাক হস্তচালিতভাৱেও সংহতি কৰিব পাৰে, আৰু মিশ্ৰিত-ভাষা ৰেকৰ্ডিংসমূহ মধ্য-ক্লিপ পৰিবৰ্তন কৰি হস্তক্ষেপ কৰা হয়।
হ্যাঁ। স্পিকার ডাইৰেকশনে প্ৰতিটো শব্দৰ (স্পিকার ১, স্পিকার ২,...) লেবেল নিৰ্ধাৰণ কৰে আৰু আপুনি সম্পাদকত সেইসমূহৰ নাম পৰিবৰ্তন কৰিব পাৰে। এইটো সমৰ্থিত সকলো আৰ্হি আৰু ভাষাত কাম কৰে।
STT.ai এ MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM আৰু AVI সহ ২০+ বিন্যাস গ্ৰহণ কৰে। আউটপুট TXT, SRT, VTT, DOCX, JSON, অথবা PDF।
Speech to text-এ শব্দত কি কোৱা হৈছিল সেইটো অনুবাদ কৰে; শব্দ চিনাক্তকৰণ (ভাষক চিনাক্তকৰণ) যিয়ে সেয়া কৈছিল সেইটো নিৰ্ধাৰণ কৰে। STT.ai-এ দুয়োটা কাম কৰে - অনুবাদ আৰু ভাষাৰ ডাইৰিজাইজেশন - কিন্তু শব্দসমূহে বিভিন্ন কাম বৰ্ণনা কৰে।
হ'ব। অডিঅ' অবিকল্পিতভাৱে প্ৰক্ৰিয়া কৰা হয় আৰু আঁতৰুৱা হয়। প্ৰো প্লানসমূহে ক্লায়েন্ট-সাইড এনক্ৰিপশন যোগ কৰে যাতে আপোনাৰ কি'ৰ অভাৱত, STT.ai লৈও, অনুলিপিসমূহ পঢ়িব নোৱাৰি, আৰু আপোনাৰ তথ্যক স্পষ্টভাবে অবিকল্পিতভাৱে মডেল প্ৰশিক্ষণৰ বাবে কখনোই ব্যৱহাৰ কৰা নহয়।
হ্যাঁ। STT.ai ত Python আৰু Node.js SDKs ৰ সৈতে এটা REST API আছে আৰু Claude আৰু Cursor ৰ বাবে এটা MCP সেৱক আছে। বিনামূলীয়া API স্তৰত ১০০ মিনিট/মাহ অন্তৰ্ভুক্ত আছে, তাৰ বাহিৰে প্ৰতি ছেকেণ্ডত বিলিং কৰা হৈছে।
হ'ব। প্ৰতিটো অনুলিপি এটা অভ্যন্তৰীণ সম্পাদকত খোলা হয় য'ত আপুনি ভুল শব্দ ঠিক কৰিব পাৰে, স্পিকারৰ নাম পৰিবৰ্তন কৰিব পাৰে, সময়চিহ্ন সংশোধন কৰিব পাৰে, আৰু টোকা যোগ কৰিব পাৰে। সম্পাদনসমূহ প্ৰতিটো এক্সপোৰ্ট বিন্যাসত স্থায়ী হয়।