Chinese (Mandarin) বক্তৃতা থেকে টেক্সট

Convert Chinese (Mandarin) (中文 (普通话)) audio to text with AI. Fast, accurate, 10+ models.

পাবলিকভাবে উপলব্ধ অডিও এবং ভিডিও সহযোগে কাজ করে। DRM-প্রতিরক্ষাপ্রাপ্ত বিষয়বস্তু সমর্থিত নয়।

উন্নত করার জন্য উন্নত করুন
Private transcript
ট্রান্সক্রিপশনের সাথে আড্ডা
Pro-র সাথে আনলক করুন →
ফাইল এখানে ফেলে দিন অথবা ব্রাউজ করতে ক্লিক করুন
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — ২GB পর্যন্ত
উন্নত করার জন্য উন্নত করুন
Private transcript
ট্রান্সক্রিপশনের সাথে আড্ডা
Pro-র সাথে আনলক করুন →
উন্নত করার জন্য উন্নত করুন
রেকর্ডিং: 0:00
বাস্তব সময় মোম (অবিলম্বে)
উন্নত Whisper (সঠিক)
পাবলিক লিংক: ২৪ ঘণ্টা, শুধু টেক্সট · নিবন্ধন করুন 7d + অডিও জন্য · প্রফেশনাল ব্যক্তিগত লিঙ্কের জন্য

বাস্তব সময়ের বাক্যের টেক্সট। আপনি কথা বললে AI স্বয়ংক্রিয়ভাবে সংশোধন করে - দীর্ঘ কথা বলার সাথে সাথে সঠিকতা উন্নত হয়।

প্রথমে মাইক্রোফোন পরীক্ষা করুন
❤️ STT.ai পছন্দ করেন? আপনার বন্ধুদের বলুন!
তুমি তোমার ফ্রি ট্রান্সক্রিপশন ব্যবহার করেছ

বিনামূল্যে ৬০০ মিনিট/মাস পেতে নিবন্ধন করুন, অথবা অসীমিত ট্রান্সক্রিপশনের জন্য আপগ্রেড করুন।

১০ মুক্ত মিনিট/দিন 600 মিনিট বিনামূল্যে সাইন আপ ক্রেডিট কার্ড নেই এনক্রিপ্ট করা
বিনামূল্যে নিবন্ধন করুন →

Best Models for Chinese (Mandarin)

Model Provider WER Speed
STT.ai Enhanced Best STT.ai 3.2% Try it
Whisper Large V3 OpenAI 4.2% Try it
Whisper Turbo OpenAI 5.1% Try it
SenseVoice FunAudioLLM 5.5% Try it
Distil-Whisper Hugging Face 5.8% Try it
Vosk Alpha Cephei 12.0% Try it

পরিচিতি Chinese (Mandarin) ট্রান্সক্রিপশন

Mandarin Chinese is the most spoken language by native speakers. STT.ai provides accurate Mandarin transcription with proper character output and tone recognition.

এসটিটি. আই. আধুনিক প্রযুক্তির সাহায্যে তথ্য প্রদান করে। Chinese (Mandarin) বহু AI মডেল দ্বারা চালিত শব্দ সনাক্তকরণ। আপনি যদি সাক্ষাৎকার, বক্তৃতা, পডকাস্ট, অথবা সভাগুলি অনুবাদ করতে চান Chinese (Mandarin)আমাদের প্ল্যাটফর্ম স্বয়ংক্রিয়ভাবে ভাষা সনাক্ত করে এবং সবচেয়ে সঠিক মডেল বেছে নেয়।

কতটা সঠিক Chinese (Mandarin) অনুবাদ?

এর জন্য সঠিকতা Chinese (Mandarin) অনুবাদ নির্ভর করে অডিও গুণমান, স্পিকার স্পষ্টতা, পটভূমির শব্দ এবং আপনি যে মডেলটি বেছে নিচ্ছেন তার ওপর। একটি স্পিকারের সাথে পরিষ্কার অডিওতে, আমাদের সেরা মডেলগুলির জন্য শব্দের ভুল হার (WER) ৬% এর নিচে। Chinese (Mandarin) -- মানব-স্তরের সঠিকতার কাছাকাছি।

সবচেয়ে ভালো ফলাফল পেতে Chinese (Mandarin) অডিও, আমরা পরামর্শ দিই:

  • অডিও মুছে ফেলুন -- পটভূমির শব্দ কমিয়ে আনো এবং ভাল মাইক্রোফোন ব্যবহার করো
  • একক স্পিকার অংশ -- মাল্টি- স্পিকার রেকর্ডিংয়ের জন্য স্পিকার ডায়ারি সক্রিয় করো
  • সঠিক মডেল বেছে নিন -- এনভিডিএ ক্যানারি সমর্থিত ভাষার জন্য সর্বনিম্ন WER প্রদান করে, যখন উইস্পার লম্বা V3 সর্ববৃহৎ ভাষার পরিধি প্রদান করে
  • ভাষা উল্লেখ করুন -- যখন স্বয়ংক্রিয়ভাবে সনাক্ত করা ভাল কাজ করে, তখন নিজে হাতে নির্বাচন করা Chinese (Mandarin) সঠিকতা সামান্য উন্নত করতে পারে

রপ্তানি ফরম্যাট Chinese (Mandarin) ট্রান্সক্রিপশন

আপনার অনুলিপি করার পরে Chinese (Mandarin) অডিও, ফলাফল ডাউনলোড করুন এই ফরম্যাটের যেকোন একটিতে:

TXT
প্লেইন টেক্সট ট্রান্সক্রিপশন
SRT
সময়সূচী সহ সাবটাইটেল
VTT
ওয়েব ভিডিও শিরোনাম
DOCX
ওয়ার্ড নথি
JSON
টাইমসটাম্প সহ গঠনমূলক তথ্য
PDF
মুদ্রণযোগ্য নথি

প্রায়শই জিজ্ঞাসিত প্রশ্ন

STT.ai-এ একটি অডিও অথবা ভিডিও ফাইল আপলোড করুন যাতে Chinese (Mandarin) (中文 (普通话)) থাকে অথবা একটি ইউআরএল সাঁটান। একটি মডেল নির্বাচন করুন যা Chinese (Mandarin) সমর্থন করে - সর্বোত্তম ফলাফল পেতে উপরের টেবিলের নিম্নতম WER-এর সাথে একটি নির্বাচন করুন - এবং অনুবাদ করুন ক্লিক করুন।

Yes. STT.ai gives every visitor 600 free minutes/month, which includes Chinese (Mandarin) (1.1 billion speakers worldwide). No signup required for your first file. Paid plans starting at $5/month unlock longer files and private transcripts.

Chinese (Mandarin) এর সঠিকতা আমাদের সেরা মডেলগুলোতে 92-96% এর মধ্যে পৌঁছেছে। Chinese (Mandarin) শব্দের মাত্রা ছাড়াই লিখে, তাই আমাদের টোকেনাইজারের সেগমেন্টগুলি ডাউনস্ট্রিম অনুসন্ধান এবং সাবটাইটেলিংয়ের জন্য উপযুক্ত।

উপরের টেবিলটি WER দ্বারা Chinese (Mandarin) এর জন্য সমর্থিত মডেলগুলির ক্রম (নিম্নতরটি ভাল)। Whisper Large V3 এর সবচেয়ে বড় Chinese (Mandarin) কভারেজ রয়েছে; NVIDIA Canary এর সমর্থিত Chinese (Mandarin) বৈচিত্র্যগুলির সর্বনিম্ন WER রয়েছে; STT.ai Enhanced দুইটিই পে-প্ল্যানের জন্য একত্রিত করে।

৮৮০০০ আউটপুট নেটিভ স্ক্রিপ্ট (৮৮০০১) ব্যবহার করে। জাপানি ভাষার জন্য, কাঞ্জি + কানা কথা বলার মতো মিশ্রিত করা হয়; মান্দারিনের জন্য, সরল বা ঐতিহ্যবাহী মডেল দ্বারা বেছে নেওয়া হয়। আপনি বিষয়- ক্লাস্টার টুল ব্যবহার করে অনুবাদ করার পর স্ক্রিপ্টগুলির মধ্যে রূপান্তর করতে পারেন।

হ্যাঁ । স্পিকার ডায়ারিজম ভাষা- অজ্ঞাত এবং ৮৮০০০- এ কাজ করে যেমনটা ইংরেজিতে করে । প্রত্যেক স্পিকারের লেবেল থাকে (স্পিকার ১, স্পিকার ২,...) এবং আপনি তাদের নাম পরিবর্তন করতে পারেন সম্পাদকে অনুবাদ করার পরে ।

বেশিরভাগ ৮৮০০০ ফাইল ৫ মিনিটের মধ্যে অনুবাদ করা হয়। ১ ঘণ্টার ৮৮০০০ অডিও ফাইল সাধারণত আমাদের দ্রুততম মডেলগুলির সাথে ২-৩ মিনিট সময় নেয়, এবং উচ্চ-সঠিক মডেলগুলির সাথে সামান্য বেশি সময় নেয়।

MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI এবং ১০+ অন্যান্য ফরম্যাটের ৮৮০০০ ফাইল সমস্ত কাজ করে। আউটপুট TXT, SRT, VTT, DOCX, JSON এবং PDF-এ - সবগুলোই ৮৮০০০ টেক্সট অক্ষত।

হ্যাঁ। ৮৮০০০ অডিও ফাইল ডিফল্টভাবে প্রসেস এবং মুছে ফেলা হয়। প্রফেশনাল প্লান ক্লায়েন্ট-সাইড এনক্রিপশন যোগ করে - এমনকি যদি আমাদের ডাটাবেস ভেঙ্গে যায়, আপনার কী ছাড়া আপনার ট্রান্সক্রিপশন পড়া যাবে না। স্পষ্টভাবে অটো-ইন না করে কখনো ৮৮০০০ তথ্য মডেল প্রশিক্ষণের জন্য ব্যবহার করা হয় না।

হ্যাঁ। ৮৮০০০ SRT এবং VTT সাবটাইটেল স্পেস ছাড়া অক্ষর সঠিকভাবে পরিচালনা করে, দীর্ঘ বাক্যাংশের মধ্যে লাইন-ব্রেক সিদ্ধান্ত সহ। তারা সব প্রধান ভিডিও প্ল্যাটফর্মে রেন্ডার করে।

হ্যাঁ। ৮৮০০০ অনুবাদ করার পর, সাবটাইটেল-অনুবাদক টুল SRT/VTT-কে ১০০+ লক্ষ্য ভাষার যেকোন একটিতে অনুবাদ করতে পারে। আপনার ৮৮০০০ বিষয়বস্তুর জন্য যদি একটি বড় দর্শকগোষ্ঠীর জন্য সাবটাইটেল প্রয়োজন হয় তবে এটি ব্যবহারযোগ্য।

হ্যাঁ। REST API ভাষা পরামিতি ব্যবহার করে Chinese (Mandarin) সমর্থন করে (স্বয়ংক্রিয়ভাবে সনাক্ত করাও সম্ভব)। Python এবং Node.js SDKs আপনাকে পূর্ণ সময়সূচী এবং স্পিকার লেবেল সহ Chinese (Mandarin) অডিও ব্যাচ-ট্রানস্ক্রাইব করতে দেয়।

৮৮০০০ এর ক্ষেত্রে, খুব দ্রুত কথা বলা বা প্রচুর উচ্চারণযুক্ত উপভাষা (আঞ্চলিক বৈচিত্র্য) সঠিকতা ক্ষতি করতে পারে। একাধিক কথা বলার মধ্যে ক্রস-ট্যাক হল সবচেয়ে বড় সমস্যা - ডায়ারিজম সাহায্য করে কিন্তু একে অপরের উপরে বলা শব্দগুলি পুনরুদ্ধার করতে পারে না।