Transcribe with STT.ai Enhanced
3.2%
WER
100
Languages
160.0x
Speed
Proprietary
License
About STT.ai Enhanced
✦ Unlock Enhanced Model
Get access to our most accurate model with any paid plan. 3.2% WER, 160x real-time speed, 100+ languages.
View Plans →Model Info
- ProviderSTT.ai
- Architecture-
- LicenseProprietary
- UpdatedMar 2026
Pyetje të shpeshta
STT.ai Enhanced është një model i fjalës në tekst nga STT.ai. STT.ai mban STT.ai Enhanced në infrastrukturën tonë të GPU kështu që mund ta përdorni pa furnizuar hardware-in tuaj — ngarkoni audion ose videon dhe zgjidhni STT.ai Enhanced nga zgjedhësi i modelit.
Në standartet e vlerësimit, STT.ai Enhanced arrin rreth 3.2% të normave të gabimeve të fjalëve. Saktësia në botën reale varet nga cilësia e audios, theksi dhe gjuha; për regjistrime me zhurmë ose theks, prit disa përqindje më të larta WER.
STT.ai Enhanced është një model premium — përfshihet me çdo plan të paguar STT.ai duke filluar nga $5/muaj. Përdoruesit e lirë mund të parashikojnë STT.ai Enhanced në klipa të shkurtër; file më të gjatë kërkojnë një plan aktiv.
STT.ai Enhanced shpërndahet nën Proprietary. Versioni i pritur i STT.ai-s merret me përputhje me licensën për ju kështu që përdorimi komercial nëpërmjet shërbimit tonë është i thjeshtë.
STT.ai Enhanced suporton 100 gjuhë. Zbulimi automatik zgjedh gjuhën e duhur për shumicën e audiove; mund ta specifikoni gjithashtu manualisht për një rritje të vogël të saktësisë.
STT.ai Enhanced përpunon audion në rreth 160.0x në kohë reale në GPU-të tona. Një file audio 1 orë përfundon në më pak se 1 minuta; file më të gjatë vënë në radhë dhe njoftohen me email kur përfundojnë.
STT.ai Enhanced ka parametrat 1.5B. Modelet më të mëdha priren të jenë më të sakta por më të ngadalshme; STT.ai hosts STT.ai Enhanced në GPU kështu që numërimi i parametrave nuk ndikon në performancën e anës së klientit.
STT.ai Enhanced pranon çdo format që suporton STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, dhe të tjerë. Shfaq si TXT, SRT, VTT, DOCX, JSON, ose PDF.
Po. Diarization e folësit punon së bashku me STT.ai Enhanced për çdo transkriptim - çdo folës është i etiketuar dhe mund t'i riemërtoni ata në editor më pas.
Po. STT.ai Enhanced punon në infrastrukturën tonë private — audiot përpunohen dhe fshihen në mënyrë të prezgjedhur. Pro+ shton kriptimin në anën e klientit kështu që transkriptat janë të pa lexueshme pa çelësin tuaj, dhe Private Cloud ju lejon të vetë-hostoni STT.ai Enhanced krejtësisht në VPC tuaj.
Përdor instrumentin compare-stt për të ekzekutuar STT.ai Enhanced kundër çdo modeli tjetër të suportuar në të njëjtin audio — do të shihni WER, numrin e segmenteve, etiketat e folësve dhe rezultatet e besimit krah-për-krah. Krahasimi STT.ai Enhanced vs Whisper Large V3 është më i zakonshmi.
Po. Specifiko "stt-ai-enhanced" si parametri i modelit në /v1/transcribe endpoint. Python dhe Node.js SDK përfshijnë shembuj STT.ai Enhanced. Niveli i API pa pagesë përfshin 100 minuta në muaj.
Liçenca për STT.ai Enhanced është vendosur nga STT.ai; vetë-hostimi varet nga kushtet e tyre. Shërbimi i STT.ai-ës shërben STT.ai Enhanced në GPU të menazhuar kështu që nuk duhet të trajtoni këtë integrim.