Transcribe with STT.ai Enhanced
3.2%
WER
100
Languages
160.0x
Speed
Proprietary
License
About STT.ai Enhanced
✦ Unlock Enhanced Model
Get access to our most accurate model with any paid plan. 3.2% WER, 160x real-time speed, 100+ languages.
View Plans →Model Info
- ProviderSTT.ai
- Architecture-
- LicenseProprietary
- UpdatedMar 2026
Usein kysyttyjä kysymyksiä
STT.ai Enhanced on STT.ai:n puheesta tekstiin -malli. STT.ai isännöi STT.ai Enhanced:ta GPU-infrastruktuurissamme, joten voit käyttää sitä ilman, että varaat omia laitteitasi – lataat äänen tai videon ja valitset STT.ai Enhanced mallinnostolaitteesta.
Standardimittauksissa STT.ai Enhanced saavuttaa noin 8801 prosentin Word Error Rate -arvon. Todellisen maailman tarkkuus riippuu äänenlaadusta, aksentista ja kielestä; äänekkäiden tai korostuneiden äänitteiden osalta WER:n odotetaan olevan muutaman prosenttiyksikön korkeampi.
STT.ai Enhanced on premium-malli, joka sisältää minkä tahansa maksullisen STT.ai dollarin suunnitelman alkaen 5 dollarista kuukaudessa. Ilmaiskäyttäjät voivat esikatsella STT.ai Enhanced:a lyhyillä klipeillä; pidemmät tiedostot vaativat aktiivisen suunnitelman.
STT.ai Enhanced on jaettu alle Proprietary. STT.ai:n isännöimä versio käsittelee lisenssien noudattamista sinulle, joten kaupallinen käyttö palvelumme kautta on yksinkertaista.
STT.ai Enhanced tukee 100 kieltä. Automaattinen havainnointi valitsee oikean kielen useimmille äänille; voit myös määrittää sen manuaalisesti pientä tarkkuusnosturia varten.
STT.ai Enhanced prosessorin äänentoisto noin 160.0x reaaliaikaisesti GPU:issa. Tunnin äänitiedosto valmistuu alle 1 minuutissa, pidempi tiedostojono ja ilmoitus sähköpostitse, kun se on tehty.
STT.ai Enhanced:ssa on 1.5B parametria. Suuremmat mallit ovat yleensä tarkempia, mutta hitaampia; STT.ai isännöi STT.ai Enhanced:a GPU:ssa, joten parametrien määrä ei vaikuta asiakaspuolen suorituskykyyn.
STT.ai Enhanced hyväksyy jokaisen formaatin STT.ai tukea: MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI ja muut. Tuotos on TXT, SRT, VTT, DOCX, JSON tai PDF.
Kyllä. Kaiuttimen diarisointi kulkee STT.ai Enhanced:n rinnalla jokaista transkriptiota kohden – jokainen puhuja on merkitty, ja voit nimetä sen myöhemmin uudelleen päätoimittajaksi.
Kyllä. STT.ai Enhanced toimii yksityisessä infrastruktuurissamme – ääni käsitellään ja poistetaan oletuksena. Pro+ lisää asiakaspuolen salauksen, joten selostuksia ei voi lukea ilman avainta, ja Private Cloud antaa sinun isännöidä STT.ai Enhanced:ta kokonaan omassa VPC:ssäsi.
Verrattuna ensimmäiseen työkaluun voit ajaa STT.ai Enhanced muuta saman äänen avulla tuettua mallia vastaan – näet WER:n, segmentin, kaiuttimen tarroja ja itseluottamuspisteitä vierekkäin. STT.ai Enhanced vs. Whisper Large V3 -vertailu on yleisin.
Kyllä. Määrittele "stt-ai-enhanced" mallimuuttujaksi /v1/transcribe-päätetapahtumassa. Python ja Node.js SDKs sisältävät STT.ai Enhanced esimerkkiä. Vapaa API-taso sisältää 100 minuuttia kuukaudessa.
STT.ai Enhanced:n lisensointi määräytyy STT.ai:n mukaan, itseohjautuvuus riippuu niiden ehdoista. STT.ai:n isännöimä palvelu toimii STT.ai Enhanced:n ohjatulla GPU:lla, joten sinun ei tarvitse hoitaa tätä integraatiota.