Transcribe with Whisper Turbo
5.1%
WER
99
Languages
32.0x
Speed
MIT
License
About Whisper Turbo
Model Info
- ProviderOpenAI
- Architecture-
- LicenseMIT
- UpdatedMar 2026
প্ৰায়শঃ সোধা প্ৰশ্নসমূহ
Whisper Turbo OpenAI ৰ দ্বাৰা এটা ভাষিক-লেখাৰ মডেল। STT.ai এ আমাৰ GPU আন্তঃগাঁথনিত Whisper Turbo ৰ হোস্ট কৰে যাতে আপুনি নিজস্ব হাৰ্ডৱেৰ প্ৰদান নকৰাকৈ ইয়াক ব্যৱহাৰ কৰিব পাৰে — অডিঅ' অথবা ভিডিঅ' আপলোড কৰক আৰু মডেল নিৰ্বাচকৰ পৰা Whisper Turbo নিৰ্বাচন কৰক।
প্ৰমিত বেঞ্চমাৰ্কত, Whisper Turbo ৰ দ্বাৰা প্ৰায় 5.1% শব্দ ত্ৰুটিৰ হাৰ প্ৰাপ্ত কৰা হয়। প্ৰকৃত বিশ্বৰ সঠিকতা অডিঅ'ৰ গুণমান, উচ্চাৰণ আৰু ভাষাৰ ওপৰত নিৰ্ভৰ কৰে; ধ্বনিময় বা উচ্চাৰণযুক্ত ৰেকৰ্ডিংৰ বাবে, WER ৰ কিছু শতাংশ উচ্চতৰ আশা কৰা হ'ব।
Whisper Turbo STT.ai ৰ বিনামূলীয়া স্তৰত চলায় — প্ৰতিজন ভ্ৰমণকাৰীক বিনামূলীয়াকৈ ৬০০ মিনিট/মাহ পোৱা যায়। পৰিশোধিত পৰিকল্পনাসমূহে প্ৰতি নথিপত্ৰৰ বাবে দীঘল সীমা, ব্যক্তিগত অনুলিপি, আৰু প্ৰাথমিকতা লাইন স্থাপন যোগ কৰে।
Whisper Turbo MIT ৰ অধীনত মুক্তি পোৱা হৈছে, এটা অনুমতিমূলক মুক্ত উৎসৰ লাইচেঞ্চ। আপুনি আপোনাৰ নিজস্ব হাৰ্ডৱেৰত Whisper Turbo স্ব-হোস্ট কৰিব পাৰে অথবা আমাৰ হোস্ট কৰা সংস্কৰণ ব্যৱহাৰ কৰিব পাৰে - দুয়োটা বাণিজ্যিকভাৱে ব্যৱহাৰযোগ্য।
Whisper Turbo এ 99 ভাষা সমৰ্থন কৰে। স্বচালিত অনুসন্ধান প্ৰক্ৰিয়াত অধিকাংশ অডিঅ'ৰ বাবে সঠিক ভাষা নিৰ্বাচন কৰা হয়; আপুনি সঠিকতা বৃদ্ধিৰ বাবে ইয়াক হস্তচালিতভাৱেও ধাৰ্য্য কৰিব পাৰে।
Whisper Turbo এ আমাৰ GPUs ত প্ৰায় 32.0x ৰিয়েল-টাইমত অডিঅ' প্ৰক্ৰিয়া কৰে। এটা ১ ঘন্টাৰ অডিঅ' ফাইল 1 মিনিটত শেষ হয়; দীঘল ফাইলসমূহ কাৰ্ডত আছে আৰু ই-মেইল দ্বাৰা জানিব যেতিয়া শেষ হয়।
Whisper Turbo ত 809M প্ৰাচল আছে। ডাঙৰ মডেল অধিক সঠিক কিন্তু ধীর; STT.ai এ GPU ত Whisper Turbo হস্ট কৰে গতিকে প্ৰাচল গণনা আপোনাৰ ক্লাএন্ট-সাইড কাৰ্যক্ষমতাক প্ৰভাৱিত নকৰে।
Whisper Turbo এ STT.ai ৰ সমৰ্থিত সকলো বিন্যাস গ্ৰহণ কৰে — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, আৰু অন্যান্য। আউটপুট TXT, SRT, VTT, DOCX, JSON, অথবা PDF হিচাপে।
হ্যাঁ। প্ৰতিটো অনুবাদৰ বাবে Whisper Turbo ৰ সৈতে স্পিকার ডায়াৰাইজেশন চলায় - প্ৰতিজন স্পিকার লেবেল কৰা হয় আৰু আপুনি পিছত সম্পাদকত তেওঁলোকক পুনৰ নাম দিব পাৰে।
হ্যাঁ। Whisper Turbo আমাৰ পৰিচালিত পৰিৱেশত চলিছে - অডিঅ' প্ৰক্ৰিয়া কৰা হয় আৰু অবিকল্পিতভাৱে আঁতৰুৱা হয় আৰু স্পষ্টভাবে অ'প-ইন নোহোৱাকৈ প্ৰশিক্ষণৰ বাবে কখনো ব্যৱহাৰ কৰা নহয়। প্ৰো প্লেনসমূহে স্থায়ীভাৱে অনুলিপিৰ বাবে ক্লায়েন্ট-সাইড এনক্ৰিপশন যোগ কৰে।
একে অডিঅ'ত অন্য সমৰ্থিত আৰ্হিৰ সৈতে Whisper Turbo চলাবলৈ compare-stt টুল ব্যৱহাৰ কৰক — আপুনি WER, সেগমেন্ট গণনা, স্পিকার লেবেল, আৰু বিশ্বাস স্কোৰ পাশে-পাশে দেখুৱাব। Whisper Turbo ৰ বিৰুদ্ধে Whisper Large V3 তুলনাটো সৰ্বাধিক প্ৰচলিত।
হ'ব। /v1/transcribe endpoint ত মডেল প্ৰাচল হিচাপে "whisper-turbo" ধাৰ্য্য কৰক। Python আৰু Node.js SDKs ত Whisper Turbo উদাহৰণ অন্তৰ্ভুক্ত আছে। বিনামূলীয়া API স্তৰত ১০০ মিনিট/মাহ অন্তৰ্ভুক্ত আছে।
হ'ব। Whisper Turbo MIT-প্ৰমাণিত হোৱাত, আপুনি ইয়াক স্ব-হোস্ট কৰিব পাৰে। STT.ai ৰ মুক্ত উৎস পৃষ্ঠাত প্ৰকল্পৰ repo আৰু ওজনৰ তালিকা আছে। অধিকাংশ উৎপাদন দলে GPU প্ৰাপ্তি, মডেল Swaps, আৰু ops এৰি যোৱাৰ বাবে আমাৰ হোস্ট কৰা সংস্কৰণ ব্যৱহাৰ কৰে।