Transcribe with STT.ai Enhanced
3.2%
WER
100
Languages
160.0x
Speed
Proprietary
License
About STT.ai Enhanced
✦ Unlock Enhanced Model
Get access to our most accurate model with any paid plan. 3.2% WER, 160x real-time speed, 100+ languages.
View Plans →Model Info
- ProviderSTT.ai
- Architecture-
- LicenseProprietary
- UpdatedMar 2026
Întrebări frecvente
STT.ai Enhanced este un model de vorbire la text până la STT.ai. STT.ai găzduiește STT.ai Enhanced pe infrastructura noastră GPU astfel încât să-l puteți utiliza fără a furniza propriul hardware – încărca audio sau video și alege STT.ai Enhanced de la selector de model.
Pe baza standardelor de referință, STT.ai Enhanced realizează aproximativ 3.2% Rata de eroare Word. Acuratețea lumii reale depinde de calitatea audio, accentul și limba; pentru înregistrări zgomotoase sau accentuate, se așteaptă la câteva puncte procentuale mai mari WER.
STT.ai Enhanced este un model de primă – inclus cu orice plan de STT.ai plătit începând cu 5 dolari pe lună. Utilizatorii gratuiti pot previzui STT.ai Enhanced pe clipuri scurte; fișierele mai lungi necesită un plan activ.
STT.ai Enhanced este distribuit sub Proprietary. Versiunea găzduită STT.ai se ocupă de conformitatea licențelor pentru tine astfel încât utilizarea comercială prin intermediul serviciului nostru este simplu.
STT.ai Enhanced suportă 100 limbi. Auto-detection alege limba corectă pentru majoritatea audio; puteți, de asemenea, să o specificați manual pentru un mic lift de precizie.
STT.ai Enhanced procesează audio la aproximativ 160.0x în timp real pe GPU-urile noastre. Un fișier audio de 1 oră se termină în sub 1 minute; fișiere mai lungi coada și notificare prin e-mail atunci când este gata.
STT.ai Enhanced are parametri 1.5B. Modelele mai mari tind să fie mai precise, dar mai lent; STT.ai găzduiește STT.ai Enhanced pe GPU astfel încât numărul de parametri nu afectează performanța client-side.
STT.ai Enhanced acceptă fiecare format de suport STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI și alții. Produsă ca TXT, SRT, VTT, DOCX, JSON sau PDF.
Da. Diarizarea speakerului merge alături de STT.ai Enhanced pentru fiecare transcriere — fiecare speaker este etichetat și le puteți renoma în editor după aceea.
Da. STT.ai Enhanced rulează în infrastructura noastră privată — audio este prelucrat și eliminat prin implicit. Pro+ adaugă criptare de partea clientului astfel că transcripțiile sunt nelegibil fără cheia ta, iar Private Cloud vă permite să vă gazduiți STT.ai Enhanced în întregime în propriul VPC.
Utilizați instrumentul compara-stt pentru a rula STT.ai Enhanced împotriva oricărui alt model suportat pe același audio — veți vedea WER, număr de segmente, etichete de speaker și scoruri de încredere lado-a-side. STT.ai Enhanced vs Whisper Large V3 comparație este cel mai frecvent rulat.
Da. Specificați "stt-ai-enhanced" ca parametrul model pe punctul final /v1/transcrie. Python și Node.js SDKs includ STT.ai Enhanced exemple. Nivelul API gratuit include 100 minute/luna.
Licența pentru STT.ai Enhanced este stabilită de STT.ai; auto-hotez depinde de termenii lor. STT.ai de serviciu găzduit execută STT.ai Enhanced pe GPU gestionat astfel încât nu este nevoie să se ocupe de această integrare.