Thai বক্তৃতা থেকে টেক্সট

Convert Thai (ไทย) audio to text with AI. Fast, accurate, 10+ models.

পাবলিকভাবে উপলব্ধ অডিও এবং ভিডিও সহযোগে কাজ করে। DRM-প্রতিরক্ষাপ্রাপ্ত বিষয়বস্তু সমর্থিত নয়।

উন্নত করার জন্য উন্নত করুন
Private transcript
ট্রান্সক্রিপশনের সাথে আড্ডা
Pro-র সাথে আনলক করুন →
ফাইল এখানে ফেলে দিন অথবা ব্রাউজ করতে ক্লিক করুন
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — ২GB পর্যন্ত
উন্নত করার জন্য উন্নত করুন
Private transcript
ট্রান্সক্রিপশনের সাথে আড্ডা
Pro-র সাথে আনলক করুন →
উন্নত করার জন্য উন্নত করুন
রেকর্ডিং: 0:00
বাস্তব সময় মোম (অবিলম্বে)
উন্নত Whisper (সঠিক)
পাবলিক লিংক: ২৪ ঘণ্টা, শুধু টেক্সট · নিবন্ধন করুন 7d + অডিও জন্য · প্রফেশনাল ব্যক্তিগত লিঙ্কের জন্য

বাস্তব সময়ের বাক্যের টেক্সট। আপনি কথা বললে AI স্বয়ংক্রিয়ভাবে সংশোধন করে - দীর্ঘ কথা বলার সাথে সাথে সঠিকতা উন্নত হয়।

প্রথমে মাইক্রোফোন পরীক্ষা করুন
❤️ STT.ai পছন্দ করেন? আপনার বন্ধুদের বলুন!
তুমি তোমার ফ্রি ট্রান্সক্রিপশন ব্যবহার করেছ

বিনামূল্যে ৬০০ মিনিট/মাস পেতে নিবন্ধন করুন, অথবা অসীমিত ট্রান্সক্রিপশনের জন্য আপগ্রেড করুন।

১০ মুক্ত মিনিট/দিন 600 মিনিট বিনামূল্যে সাইন আপ ক্রেডিট কার্ড নেই এনক্রিপ্ট করা
বিনামূল্যে নিবন্ধন করুন →

Best Models for Thai

Model Provider WER Speed
STT.ai Enhanced Best STT.ai 3.2% Try it
Whisper Large V3 OpenAI 4.2% Try it
Whisper Turbo OpenAI 5.1% Try it
SenseVoice FunAudioLLM 5.5% Try it
Distil-Whisper Hugging Face 5.8% Try it

পরিচিতি Thai ট্রান্সক্রিপশন

Thai is a tonal language with no spaces between words. STT.ai handles Thai word segmentation and tonal distinctions for accurate transcription.

এসটিটি. আই. আধুনিক প্রযুক্তির সাহায্যে তথ্য প্রদান করে। Thai বহু AI মডেল দ্বারা চালিত শব্দ সনাক্তকরণ। আপনি যদি সাক্ষাৎকার, বক্তৃতা, পডকাস্ট, অথবা সভাগুলি অনুবাদ করতে চান Thaiআমাদের প্ল্যাটফর্ম স্বয়ংক্রিয়ভাবে ভাষা সনাক্ত করে এবং সবচেয়ে সঠিক মডেল বেছে নেয়।

কতটা সঠিক Thai অনুবাদ?

এর জন্য সঠিকতা Thai অনুবাদ নির্ভর করে অডিও গুণমান, স্পিকার স্পষ্টতা, পটভূমির শব্দ এবং আপনি যে মডেলটি বেছে নিচ্ছেন তার ওপর। একটি স্পিকারের সাথে পরিষ্কার অডিওতে, আমাদের সেরা মডেলগুলির জন্য শব্দের ভুল হার (WER) ৬% এর নিচে। Thai -- মানব-স্তরের সঠিকতার কাছাকাছি।

সবচেয়ে ভালো ফলাফল পেতে Thai অডিও, আমরা পরামর্শ দিই:

  • অডিও মুছে ফেলুন -- পটভূমির শব্দ কমিয়ে আনো এবং ভাল মাইক্রোফোন ব্যবহার করো
  • একক স্পিকার অংশ -- মাল্টি- স্পিকার রেকর্ডিংয়ের জন্য স্পিকার ডায়ারি সক্রিয় করো
  • সঠিক মডেল বেছে নিন -- এনভিডিএ ক্যানারি সমর্থিত ভাষার জন্য সর্বনিম্ন WER প্রদান করে, যখন উইস্পার লম্বা V3 সর্ববৃহৎ ভাষার পরিধি প্রদান করে
  • ভাষা উল্লেখ করুন -- যখন স্বয়ংক্রিয়ভাবে সনাক্ত করা ভাল কাজ করে, তখন নিজে হাতে নির্বাচন করা Thai সঠিকতা সামান্য উন্নত করতে পারে

রপ্তানি ফরম্যাট Thai ট্রান্সক্রিপশন

আপনার অনুলিপি করার পরে Thai অডিও, ফলাফল ডাউনলোড করুন এই ফরম্যাটের যেকোন একটিতে:

TXT
প্লেইন টেক্সট ট্রান্সক্রিপশন
SRT
সময়সূচী সহ সাবটাইটেল
VTT
ওয়েব ভিডিও শিরোনাম
DOCX
ওয়ার্ড নথি
JSON
টাইমসটাম্প সহ গঠনমূলক তথ্য
PDF
মুদ্রণযোগ্য নথি

প্রায়শই জিজ্ঞাসিত প্রশ্ন

STT.ai-এ একটি অডিও অথবা ভিডিও ফাইল আপলোড করুন যাতে Thai (ไทย) থাকে অথবা একটি ইউআরএল সাঁটান। একটি মডেল নির্বাচন করুন যা Thai সমর্থন করে - সর্বোত্তম ফলাফল পেতে উপরের টেবিলের নিম্নতম WER-এর সাথে একটি নির্বাচন করুন - এবং অনুবাদ করুন ক্লিক করুন।

Yes. STT.ai gives every visitor 600 free minutes/month, which includes Thai (61 million speakers worldwide). No signup required for your first file. Paid plans starting at $5/month unlock longer files and private transcripts.

পরিষ্কার অডিওতে ৮৮০০০ এর সঠিকতা আমাদের সেরা মডেলের ক্ষেত্রে ৮৮-৯৩% পর্যন্ত পৌঁছে যায়। উৎস অডিওতে পরিষ্কার টোন থাকলে টোনাল ন্যুএন্স সংরক্ষিত থাকে; ৯৬ কেবিপিএস এর নিচে lossy compress টোনাল সঠিকতা কমিয়ে দিতে পারে।

উপরের টেবিলটি WER দ্বারা Thai এর জন্য সমর্থিত মডেলগুলির ক্রম (নিম্নতরটি ভাল)। Whisper Large V3 এর সবচেয়ে বড় Thai কভারেজ রয়েছে; NVIDIA Canary এর সমর্থিত Thai বৈচিত্র্যগুলির সর্বনিম্ন WER রয়েছে; STT.ai Enhanced দুইটিই পে-প্ল্যানের জন্য একত্রিত করে।

হ্যাঁ । ৮৮০০০ আউটপুট ভিন্নতা (বিন্দু, কমন, প্রশ্ন চিহ্ন) এবং সঠিক ক্যাসেজ অন্তর্ভুক্ত করে । সংখ্যা এবং শিরোনাম ৮৮০০০ কনভেনশন অনুসরণ করে । ট্রান্সক্রিপ্ট সম্পাদক আপনাকে নিজে হাতে ভিন্নতা পরিবর্তন করতে দেয় ।

হ্যাঁ । স্পিকার ডায়ারিজম ভাষা- অজ্ঞাত এবং ৮৮০০০- এ কাজ করে যেমনটা ইংরেজিতে করে । প্রত্যেক স্পিকারের লেবেল থাকে (স্পিকার ১, স্পিকার ২,...) এবং আপনি তাদের নাম পরিবর্তন করতে পারেন সম্পাদকে অনুবাদ করার পরে ।

বেশিরভাগ ৮৮০০০ ফাইল ৫ মিনিটের মধ্যে অনুবাদ করা হয়। ১ ঘণ্টার ৮৮০০০ অডিও ফাইল সাধারণত আমাদের দ্রুততম মডেলগুলির সাথে ২-৩ মিনিট সময় নেয়, এবং উচ্চ-সঠিক মডেলগুলির সাথে সামান্য বেশি সময় নেয়।

MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI এবং ১০+ অন্যান্য ফরম্যাটের ৮৮০০০ ফাইল সমস্ত কাজ করে। আউটপুট TXT, SRT, VTT, DOCX, JSON এবং PDF-এ - সবগুলোই ৮৮০০০ টেক্সট অক্ষত।

হ্যাঁ। ৮৮০০০ অডিও ফাইল ডিফল্টভাবে প্রসেস এবং মুছে ফেলা হয়। প্রফেশনাল প্লান ক্লায়েন্ট-সাইড এনক্রিপশন যোগ করে - এমনকি যদি আমাদের ডাটাবেস ভেঙ্গে যায়, আপনার কী ছাড়া আপনার ট্রান্সক্রিপশন পড়া যাবে না। স্পষ্টভাবে অটো-ইন না করে কখনো ৮৮০০০ তথ্য মডেল প্রশিক্ষণের জন্য ব্যবহার করা হয় না।

হ্যাঁ। ট্রান্সক্রিপ্টটি SRT অথবা VTT হিসাবে রপ্তানি করুন - উভয়ই ইউটিউব, ভিমিও, টিকটক এবং সব প্রধান ভিডিও প্ল্যাটফর্মের সাথে কাজ করে। সাবটাইটেল টুলটি ভিডিওতে হার্ডসাব হিসাবে ওভারলে করে।

হ্যাঁ। ৮৮০০০ অনুবাদ করার পর, সাবটাইটেল-অনুবাদক টুল SRT/VTT-কে ১০০+ লক্ষ্য ভাষার যেকোন একটিতে অনুবাদ করতে পারে। আপনার ৮৮০০০ বিষয়বস্তুর জন্য যদি একটি বড় দর্শকগোষ্ঠীর জন্য সাবটাইটেল প্রয়োজন হয় তবে এটি ব্যবহারযোগ্য।

হ্যাঁ। REST API ভাষা পরামিতি ব্যবহার করে Thai সমর্থন করে (স্বয়ংক্রিয়ভাবে সনাক্ত করাও সম্ভব)। Python এবং Node.js SDKs আপনাকে পূর্ণ সময়সূচী এবং স্পিকার লেবেল সহ Thai অডিও ব্যাচ-ট্রানস্ক্রাইব করতে দেয়।

Thai এর জন্য, সবচেয়ে বড় সঠিকতা ভেরিয়েবল হল পটভূমির শব্দ, স্পিকারের ওভারল্যাপ এবং উচ্চারণ শক্তি। একটি ভাল মাইক্রোফোন ব্যবহার করুন, সম্ভব হলে আলাদা স্পিকার ব্যবহার করুন এবং একটি মডেল বেছে নিন যা উপযুক্ত উপভাষায় প্রশিক্ষিত।