Transcribe with STT.ai Enhanced
3.2%
WER
100
Languages
160.0x
Speed
Proprietary
License
About STT.ai Enhanced
✦ Unlock Enhanced Model
Get access to our most accurate model with any paid plan. 3.2% WER, 160x real-time speed, 100+ languages.
View Plans →Model Info
- ProviderSTT.ai
- Architecture-
- LicenseProprietary
- UpdatedMar 2026
Često postavljana pitanja
STT.ai je domaćin STT.ai Enhanced na našoj GPU infrastrukturi tako da ga možete koristiti bez da osigurate svoj vlastiti hardver — uploadati audio ili video i izabrati STT.ai Enhanced iz birača modela.
Na standardnim benchmarkima, STT.ai Enhanced postiže oko 3.2% stope greške riječi. realna tačnost zavisi od kvaliteta zvuka, naglaska i jezika; za bučne ili naglašene snimke, očekujte nekoliko postotnih bodova više WER.
STT.ai Enhanced je premium model — uključen sa bilo kojim plaćenim STT.ai planom počevši od $5/mjesečno.Besplatni korisnici mogu pregledati STT.ai Enhanced na kratkim isječcima; dulje datoteke zahtijevaju aktivan plan.
STT.ai Enhanced je distribuiran pod Proprietary. hosted verzija STT.ai-a se brine za licenciranje umjesto vas tako da je komercijalna upotreba putem naše usluge jednostavna.
STT.ai Enhanced podržava 100 jezika. Automatsko otkrivanje bira ispravan jezik za većinu audio; također ga možete ručno odrediti za malo povećanje tačnosti.
STT.ai Enhanced obrađuje audio na oko 160.0x real-time na našim GPU-ovima. 1-satna audio datoteka završava za manje od 1 minuta; dulje datoteke čekaju i obavještavaju e-mailom kada je završeno.
STT.ai Enhanced ima 1.5B parametra. Veći modeli imaju tendenciju da budu precizniji ali sporiji; STT.ai hosta STT.ai Enhanced na GPU tako da broj parametara ne utječe na performanse klijenta.
STT.ai Enhanced prihvaća svaki format koji podržava STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI i drugi. izlaz kao TXT, SRT, VTT, DOCX, JSON, ili PDF.
Da. Diarizacija govornika radi zajedno sa STT.ai Enhanced za svaku transkripciju - svaki govornik je označen i možete ih preimenovati u editoru kasnije.
Da. STT.ai Enhanced radi u našoj privatnoj infrastrukturi - audio se obrađuje i briše po defaultu. Pro+ dodaje šifriranje na strani klijenta tako da su transkripti nečitljivi bez vašeg ključa, a Privatni oblak vam omogućava da sami hostujete STT.ai Enhanced u potpunosti u vašem vlastitom VPC-u.
Koristite compare-stt alat da pokrenete STT.ai Enhanced protiv bilo kojeg drugog podržanog modela na istom audio — vidjet ćete WER, broj segmenata, oznake zvučnika, i pouzdanost ocjena jedan pored drugog. STT.ai Enhanced vs Whisper Large V3 usporedba je najčešća.
Da. Navedite "stt-ai-enhanced" kao modelni parametar na /v1/transcribe krajnjoj tački. Python i Node.js SDK-ovi uključuju STT.ai Enhanced primjere. Besplatni API nivo uključuje 100 minuta/mjesečno.
Licenciranje za STT.ai Enhanced je postavljeno od strane STT.ai; samo-hosting zavisi od njihovih uvjeta. STT.ai-in hosted servis pokreće STT.ai Enhanced na upravljanom GPU-u tako da ne morate rukovati tom integracijom.