Transcribe with STT.ai Enhanced
3.2%
WER
100
Languages
160.0x
Speed
Proprietary
License
About STT.ai Enhanced
✦ Unlock Enhanced Model
Get access to our most accurate model with any paid plan. 3.2% WER, 160x real-time speed, 100+ languages.
View Plans →Model Info
- ProviderSTT.ai
- Architecture-
- LicenseProprietary
- UpdatedMar 2026
প্ৰায়শঃ সোধা প্ৰশ্নসমূহ
STT.ai Enhanced STT.ai ৰ দ্বাৰা এটা ভাষিক-লেখাৰ মডেল। STT.ai এ আমাৰ GPU আন্তঃগাঁথনিত STT.ai Enhanced ৰ হোস্ট কৰে যাতে আপুনি নিজস্ব হাৰ্ডৱেৰ প্ৰদান নকৰাকৈ ইয়াক ব্যৱহাৰ কৰিব পাৰে — অডিঅ' অথবা ভিডিঅ' আপলোড কৰক আৰু মডেল নিৰ্বাচকৰ পৰা STT.ai Enhanced নিৰ্বাচন কৰক।
প্ৰমিত বেঞ্চমাৰ্কত, STT.ai Enhanced ৰ দ্বাৰা প্ৰায় 3.2% শব্দ ত্ৰুটিৰ হাৰ প্ৰাপ্ত কৰা হয়। প্ৰকৃত বিশ্বৰ সঠিকতা অডিঅ'ৰ গুণমান, উচ্চাৰণ আৰু ভাষাৰ ওপৰত নিৰ্ভৰ কৰে; ধ্বনিময় বা উচ্চাৰণযুক্ত ৰেকৰ্ডিংৰ বাবে, WER ৰ কিছু শতাংশ উচ্চতৰ আশা কৰা হ'ব।
STT.ai Enhanced এটা প্ৰিমিয়াম মডেল - যিকোনো $5/মাহ আৰম্ভণিৰ সৈতে STT.ai পৰিকল্পনাৰ সৈতে অন্তৰ্ভুক্ত। বিনামূলীয়া ব্যৱহাৰকাৰীসকলে সৰু ক্লিপসমূহত STT.ai Enhanced পূৰ্বদৰ্শন কৰিব পাৰে; দীঘল ফাইলসমূহৰ বাবে এটা সক্ৰিয় পৰিকল্পনাৰ প্ৰয়োজন।
STT.ai Enhanced Proprietary ৰ অধীনত বিতৰিত হৈছে। STT.ai ৰ হোস্ট কৰা সংস্কৰণে আপোনাৰ বাবে লাইচেঞ্চিং অনুমোদন ব্যৱস্থাপনা কৰে যাতে আমাৰ সেৱাৰ মাধ্যমে বাণিজ্যিক ব্যৱহাৰ সহজ হয়।
STT.ai Enhanced এ 100 ভাষা সমৰ্থন কৰে। স্বচালিত অনুসন্ধান প্ৰক্ৰিয়াত অধিকাংশ অডিঅ'ৰ বাবে সঠিক ভাষা নিৰ্বাচন কৰা হয়; আপুনি সঠিকতা বৃদ্ধিৰ বাবে ইয়াক হস্তচালিতভাৱেও ধাৰ্য্য কৰিব পাৰে।
STT.ai Enhanced এ আমাৰ GPUs ত প্ৰায় 160.0x ৰিয়েল-টাইমত অডিঅ' প্ৰক্ৰিয়া কৰে। এটা ১ ঘন্টাৰ অডিঅ' ফাইল 1 মিনিটত শেষ হয়; দীঘল ফাইলসমূহ কাৰ্ডত আছে আৰু ই-মেইল দ্বাৰা জানিব যেতিয়া শেষ হয়।
STT.ai Enhanced ত 1.5B প্ৰাচল আছে। ডাঙৰ মডেল অধিক সঠিক কিন্তু ধীর; STT.ai এ GPU ত STT.ai Enhanced হস্ট কৰে গতিকে প্ৰাচল গণনা আপোনাৰ ক্লাএন্ট-সাইড কাৰ্যক্ষমতাক প্ৰভাৱিত নকৰে।
STT.ai Enhanced এ STT.ai ৰ সমৰ্থিত সকলো বিন্যাস গ্ৰহণ কৰে — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, আৰু অন্যান্য। আউটপুট TXT, SRT, VTT, DOCX, JSON, অথবা PDF হিচাপে।
হ্যাঁ। প্ৰতিটো অনুবাদৰ বাবে STT.ai Enhanced ৰ সৈতে স্পিকার ডায়াৰাইজেশন চলায় - প্ৰতিজন স্পিকার লেবেল কৰা হয় আৰু আপুনি পিছত সম্পাদকত তেওঁলোকক পুনৰ নাম দিব পাৰে।
হ্যাঁ। STT.ai Enhanced আমাৰ ব্যক্তিগত আন্তঃগাঁথনিত চলায় — অডিঅ' প্ৰক্ৰিয়া কৰা হয় আৰু অবিকল্পিতভাৱে আঁতৰুৱা হয়। Pro+ এ ক্লায়েন্ট-সাইড এনক্ৰিপচন যোগ কৰে যাতে আপোনাৰ কি'ৰ অভাৱত অনুবাদসমূহ পঢ়িব নোৱাৰি, আৰু ব্যক্তিগত ক্লাউডে আপুনি আপোনাৰ নিজস্ব VPC ত সম্পূৰ্ণৰূপে স্ব-হোস্ট STT.ai Enhanced কৰিব পাৰে।
একে অডিঅ'ত অন্য সমৰ্থিত আৰ্হিৰ সৈতে STT.ai Enhanced চলাবলৈ compare-stt টুল ব্যৱহাৰ কৰক — আপুনি WER, সেগমেন্ট গণনা, স্পিকার লেবেল, আৰু বিশ্বাস স্কোৰ পাশে-পাশে দেখুৱাব। STT.ai Enhanced ৰ বিৰুদ্ধে Whisper Large V3 তুলনাটো সৰ্বাধিক প্ৰচলিত।
হ'ব। /v1/transcribe endpoint ত মডেল প্ৰাচল হিচাপে "stt-ai-enhanced" ধাৰ্য্য কৰক। Python আৰু Node.js SDKs ত STT.ai Enhanced উদাহৰণ অন্তৰ্ভুক্ত আছে। বিনামূলীয়া API স্তৰত ১০০ মিনিট/মাহ অন্তৰ্ভুক্ত আছে।
STT.ai Enhanced ৰ বাবে লাইচেঞ্চিং STT.ai দ্বাৰা নিৰ্ধাৰিত হয়; স্ব-হোস্টিং তেওঁলোকৰ শৰ্তাৱলীৰ ওপৰত নিৰ্ভৰ কৰে। STT.ai ৰ হোস্ট কৰা সেৱা দ্বাৰা STT.ai Enhanced পৰিচালিত GPU ত চলা হয় গতিকে আপুনি সেই একত্ৰীকৰণ ব্যৱস্থাপনা কৰিব নালাগে।