Transcribe with STT.ai Enhanced
3.2%
WER
100
Languages
160.0x
Speed
Proprietary
License
About STT.ai Enhanced
✦ Unlock Enhanced Model
Get access to our most accurate model with any paid plan. 3.2% WER, 160x real-time speed, 100+ languages.
View Plans →Model Info
- ProviderSTT.ai
- Architecture-
- LicenseProprietary
- UpdatedMar 2026
प्राय सोधिने प्रश्नहरू
STT.ai Enhanced STT.ai द्वारा एक भाषण-देखि-पाठ मोडेल हो। STT.ai हाम्रो GPU पूर्वाधारमा STT.ai Enhanced होस्ट गर्दछ ताकि तपाईं आफ्नो हार्डवेयरको प्रावधान बिना यसलाई प्रयोग गर्न सक्नुहुन्छ - अडियो वा भिडियो अपलोड गर्नुहोस् र मोडेल चयनकर्ताबाट STT.ai Enhanced चयन गर्नुहोस्।
मानक बेन्चमार्क मा, STT.ai Enhanced वरिपरि 3.2% शब्द त्रुटि दर प्राप्त गर्दछ। वास्तविक-विश्व सटीकता अडियो गुणस्तर, उच्चारण, र भाषा निर्भर गर्दछ; हल्ला वा उच्चारण रेकर्ड लागि, केही प्रतिशत अंक उच्च WER अपेक्षा।
STT.ai Enhanced एक प्रिमियम मोडेल हो - कुनै पनि भुक्तानी STT.ai योजना संग समावेश $5/महिना मा सुरु. नि: शुल्क प्रयोगकर्ता छोटो क्लिप मा STT.ai Enhanced पूर्वावलोकन गर्न सक्नुहुन्छ; लामो फाइलहरू सक्रिय योजना आवश्यक.
STT.ai Enhanced Proprietary अन्तर्गत वितरित गरिएको छ। STT.ai को होस्ट गरिएको संस्करणले तपाईंको लागि लाइसेन्स अनुपालन ह्यान्डल गर्दछ ताकि हाम्रो सेवा मार्फत व्यावसायिक प्रयोग सीधा छ।
STT.ai Enhanced ले 100 भाषाहरू समर्थन गर्दछ । स्वचालित पत्ता लगाउनले धेरै अडियोका लागि सही भाषा चयन गर्दछ; तपाईँले सानो सटीकता लिफ्टका लागि यसलाई म्यानुअल रूपमा पनि निर्दिष्ट गर्न सक्नुहुन्छ ।
STT.ai Enhanced हाम्रो GPUs मा 160.0x वास्तविक समयमा अडियो प्रक्रिया गर्दछ। एक 1-घण्टा अडियो फाइल 1 मिनेट अन्तर्गत समाप्त हुन्छ; लामो फाइलहरू लामबद्ध र इमेल द्वारा सूचना दिनुहोस् जब यो पूरा हुन्छ।
STT.ai Enhanced मा 1.5B परिमितिहरू छन्। ठूला नमूनाहरू अधिक सटीक तर ढिलो हुन्छन्; STT.ai ले GPU मा STT.ai Enhanced होस्ट गर्दछ त्यसैले परिमिति गणनाले तपाईँको क्लाइन्ट-साइड प्रदर्शनलाई असर गर्दैन।
STT.ai Enhanced हरेक ढाँचा स्वीकार गर्दछ STT.ai समर्थन - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, र अन्य. TXT, SRT, VTT, DOCX, JSON, वा PDF रूपमा निर्गत।
हो. वक्ता diarization साथै चल्छ STT.ai Enhanced हरेक प्रतिलिपि लागि — प्रत्येक वक्ता लेबल छ र तपाईं पछि सम्पादक तिनीहरूलाई पुन: नाम गर्न सक्नुहुन्छ.
हो। STT.ai Enhanced हाम्रो निजी पूर्वाधार चल्छ - अडियो प्रक्रिया र पूर्वनिर्धारित द्वारा मेटिएको छ। प्रो + क्लाइन्ट-साइड गुप्तिकरण थप्छ त्यसैले transcripts आफ्नो कुञ्जी बिना पढ्नयोग्य छन्, र निजी क्लाउड तपाईंलाई पूर्ण रूपमा आफ्नो VPC मा आत्म-होस्ट STT.ai Enhanced दिन्छ।
तुलना-STT उपकरण प्रयोग गर्न STT.ai Enhanced उही अडियो मा कुनै पनि अन्य समर्थित मोडेल विरुद्ध चलाउन - तपाईं WER देख्नेछन्, खण्ड गणना, वक्ता लेबल, र आत्मविश्वास स्कोर साइड-by-साइड. को STT.ai Enhanced विरुद्ध Whisper ठूलो V3 तुलना सबैभन्दा सामान्यतया चलाउन छ.
हो । /v1/transcribe अन्त बिन्दुमा मोडेल परिमितिको रूपमा "stt-ai-enhanced" निर्दिष्ट गर्नुहोस् । पाइथन र Node.js SDKs STT.ai Enhanced उदाहरण समावेश गर्दछ । निःशुल्क API तहमा 100 मिनेट / महिना समावेश छ ।
STT.ai Enhanced को लागि लाइसेन्स STT.ai द्वारा सेट गरिएको छ; स्व-होस्टिङ तिनीहरूको शर्तहरूमा निर्भर गर्दछ। STT.ai को होस्ट गरिएको सेवाले STT.ai Enhanced प्रबन्धित GPU मा चलाउँछ ताकि तपाईंलाई त्यो एकीकरण ह्यान्डल गर्न आवश्यक पर्दैन।