सह ट्रान्सक्राइब Whisper Turbo
5.1%
WER
99
Languages
32.0x
Speed
MIT
License
बद्दल Whisper Turbo
Whisper Turbo (large-v3-turbo) is a distilled version of Whisper Large V3 that dramatically reduces inference time while maintaining competitive accuracy. With only 4 decoder layers instead of 32, it achieves a 4x speedup.
Model Info
- ProviderOpenAI
- Architecture-
- LicenseMIT
- UpdatedMar 2026
वारंवार विचारले जाणारे प्रश्न
८८०००१ हे OpenAI द्वारे भाषण-ते-पाठ्य मॉडेल आहे. STT.ai आपल्या GPU पायाभूत सुविधावर Whisper Turbo चे यजमान आहे जेणेकरून आपण स्वतःचे हार्डवेअर पुरविल्याशिवाय ते वापरू शकता - ऑडिओ किंवा व्हिडिओ अपलोड करा आणि मॉडेल निवडक Whisper Turbo निवडा.
Whisper Turbo% शब्द त्रुटी दर मानक बेंचमार्कवर, Whisper Turbo प्राप्त करते. वास्तविक विश्वातील अचूकता ऑडिओ गुणवत्ता, उच्चार आणि भाषावर अवलंबून असते; गडबड किंवा उच्चारलेल्या रेकॉर्डिंगसाठी, काही टक्के अधिक WER ची अपेक्षा करा.
Whisper Turbo runs on STT.ai's free tier — every visitor gets 600 minutes/month at no cost. Paid plans add longer per-file limits, private transcripts, and priority queueing.
Whisper Turbo MIT अंतर्गत जारी केले आहे, एक अनुमती मुक्त-स्रोत परवाना. आपण स्वतःच्या हार्डवेअरवर Whisper Turbo स्वयं-होस्ट करू शकता किंवा आमच्या होस्ट केलेल्या आवृत्ती वापरू शकता - दोन्ही व्यावसायिक वापरासाठी आहेत.
Whisper Turbo 99 भाषांना समर्थन देतो. स्वयं-शोधने बहुतेक ऑडिओ करीता योग्य भाषा निवडते; तुम्ही थोडी अचूकता वाढविण्याकरीता स्वतःच ते निश्चित करू शकता.
Whisper Turbo ऑडिओ प्रक्रिया आपल्या GPU वर 32.0x वास्तविक वेळेत करते. 1 तास ऑडिओ फाइल 1 मिनिटांच्या आत पूर्ण होते; लांब फाइल कतार आणि पूर्ण झाल्यावर ईमेल द्वारे सूचना.
Whisper Turbo मध्ये 809M पैरामीटर आहेत. मोठे मॉडेल अधिक अचूक पण मंद असतात; STT.ai GPU वर Whisper Turbo चे यजमान आहे त्यामुळे पैरामीटरची संख्या तुमच्या क्लाऐंट-साइड कार्यक्षमतेवर परिणाम करत नाही.
Whisper Turbo प्रत्येक स्वरूप स्वीकारते STT.ai समर्थन — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, आणि इतर. आऊटपुट TXT, SRT, VTT, DOCX, JSON, किंवा PDF म्हणून.
Whisper Turbo प्रत्येक प्रतीसाठी स्पीकर डायराइजेशन सोबत चालते - प्रत्येक स्पीकर लेबल केले जाते आणि आपण संपादकात नंतर त्यांना पुनर्नामांकित करू शकता.
Whisper Turbo आमच्या व्यवस्थापित वातावरणात चालते - ऑडिओ प्रक्रिया आणि मुलभूतरित्या काढून टाकली जाते आणि स्पष्टपणे निवडल्याशिवाय प्रशिक्षणासाठी कधीही वापरले जात नाही. प्रो योजना स्थिर ट्रान्सक्रिप्टसाठी क्लायंट-साइड एन्क्रिप्शन जोडते.
Whisper Turbo विरुद्ध इतर कोणत्याही समर्थित मॉडेलवर तेच ऑडिओ चालविण्यासाठी तुलना-stt साधन वापरा - तुम्हाला WER, खंडांची संख्या, स्पीकर लेबल आणि विश्वासार्हता गुण पाहायचे आहेत. Whisper Turbo विरुद्ध Whisper Large V3 तुलना सर्वात सामान्यपणे चालविली जाते.
होय. /v1/transcribe endpoint वर मॉडेल परिमाण म्हणून "whisper-turbo" निर्देशित करा. Python आणि Node.js SDKs मध्ये Whisper Turbo उदाहरणे समाविष्ट आहेत. मोफत API स्तरात 100 मिनिट / महिन्याचा समावेश आहे.
होय. Whisper Turbo हे MIT-लाइसेन्स्ड आहे, म्हणून तुम्ही ते स्वतःच होस्ट करू शकता. STT.ai चे ओपन सोर्स पान प्रकल्प रेपो आणि वजनांची यादी दर्शवते. बहुतेक उत्पादन संघ GPU खरेदी, मॉडेल स्वॅप्स आणि ऑप्स सोडण्यासाठी आमची होस्ट केलेली आवृत्ती वापरतात.