মডেল	WER	গতি	ভাষা	এর জন্য সেরা
STT.ai Enhanced	3.2%	160.0x	100	শ্রেষ্ঠ-শ্রেণীর সঠিকতা এবং গতি সহ STT.ai এর প্রধান বাক্যের-থেকে-টেক্সট মডেল। …
Whisper Large V3	4.2%	8.0x	99	OpenAI's বৃহত্তম এবং সবচেয়ে সঠিক Whisper মডেল। ৯৯টি ভাষার সাথে …
Whisper Turbo	5.1%	32.0x	99	OpenAI's speed-optimised Whisper সংস্করণ। Large V3 এর চেয়ে ৪ গুণ …
NVIDIA Canary	3.5%	45.0x	4	ইংরেজি ভাষায় সর্বোচ্চ পর্যায়ের সঠিকতার সাথে NVIDIA'র মাল্টি-টাস্ক ASR মডেল। …
Moonshine	7.8%	80.0x	1	অতি-হালকা ASR মডেল, প্রান্তীয় ডিভাইসের জন্য ডিজাইন করা হয়েছে। রাসবেরি …
NVIDIA Parakeet	3.0%	55.0x	1	এনভিডিয়ার CTC-ভিত্তিক ইংরেজি ASR মডেল। সবচেয়ে সঠিক মুক্ত-সোর্স ইংরেজি মডেলগুলির …
SenseVoice	5.5%	50.0x	50	আবেগ স্বীকৃতি এবং অডিও ঘটনা সনাক্তকরণ সহ বহুভাষী কথা বুঝতে …
Distil-Whisper	5.8%	48.0x	99	Whisper Large V3 এর ডিস্টিলেড সংস্করণ । ৬x দ্রুততর, ৪৯% …
Vosk	12.0%	100.0x	20	হালকা অফলাইন বাক সনাক্তকরণ। ইন্টারনেট ছাড়া কাজ করে, গোপনীয়তা সংবেদনশীল …

ওয়ার্ড ত্রুটি হার (Word Error Rate) কি?

শব্দ ত্রুটি হার (WER) হল বক্তৃতা স্বীকৃতি সঠিকতা পরিমাপ করার জন্য একটি আদর্শ মেট্রিক । এটি একটি ট্রান্সক্রিপ্ট মধ্যে শব্দের শতাংশ গণনা করে যা রেফারেন্স থেকে ভিন্ন । একটি WER এর ৫% মানে প্রতি ১০০ শব্দের মধ্যে প্রায় ৫ একটি ত্রুটি আছে । কম ভাল ।

পেশাদার মানব অনুবাদকরা সাধারণত ৪-৫% এর ওয়ারের মাত্রা অর্জন করে। সবচেয়ে ভালো এআই মডেলগুলো এখন পরিষ্কার অডিওতে মানব-স্তরের সঠিকতার সাথে মিল রাখে বা তার কাছাকাছি যায়।

কোন মডেল ব্যবহার করতে হবে তা নিশ্চিত নন?

আমাদের ডিফল্ট চেষ্টা করুন — Whisper Large V3 Turbo গতি এবং সঠিকতার মধ্যে সর্বোত্তম ভারসাম্য প্রদান করে। শুরু করার জন্য বিনামূল্যে, কোন নিবন্ধন প্রয়োজন নেই।

মুক্তভাবে অনুবাদ শুরু করুন