Transcribe with STT.ai Enhanced
3.2%
WER
100
Languages
160.0x
Speed
Proprietary
License
About STT.ai Enhanced
✦ Unlock Enhanced Model
Get access to our most accurate model with any paid plan. 3.2% WER, 160x real-time speed, 100+ languages.
View Plans →Model Info
- ProviderSTT.ai
- Architecture-
- LicenseProprietary
- UpdatedMar 2026
Dažnai užduodami klausimai
STT.ai Enhanced yra kalbos-teksto modelis iki STT.ai. STT.ai savo GPU infrastruktūroje sumontuoti STT.ai Enhanced, todėl jį galite naudoti neįrengdami savo techninės įrangos – įkelkite garso ar vaizdo ir pasirinkite STT.ai Enhanced iš modelio parinkiklis.
Dėl standartinių lyginamųjų standartų, STT.ai Enhanced pasiekia apie 8801% Word error Rate. Realaus pasaulio tikslumas priklauso nuo garso kokybės, akcentas, ir kalba; Triukšmingų ar akcentuotų įrašų, tikėtis keletą procentinių punktų didesnis WER.
STT.ai Enhanced yra premium modelis — įtrauktas su bet kuriuo mokamas STT.ai planas prasideda $5/mėnesis. Nemokami vartotojai gali peržiūrėti STT.ai Enhanced trumpų klipų; ilgesni failai reikalauja aktyvaus plano.
STT.ai Enhanced yra platinama pagal Proprietary. STT.ai įdiegta versija tvarko licencijavimo atitikties jums taip komercinis naudojimas per mūsų paslaugas yra paprasta.
STT.ai Enhanced palaiko 100 kalbas. Automatinis aptikimas pasirenka reikiamą kalbą daugumai garso; taip pat galite nurodyti ją rankiniu būdu nedideliam tikslumui pakelti.
STT.ai Enhanced apdoroja garsą maždaug 160.0x realiu laiku mūsų GPU. 1 valandos garso failas baigiasi po 1 minučių; ilgesnis failų eilė ir apie tai praneš el. paštu, kai tai bus padaryta.
STT.ai Enhanced turi 1.5B parametrus. Didesni modeliai yra tikslesni, bet lėčiau; STT.ai GPU mazgai STT.ai Enhanced, todėl parametrų skaičius neturi įtakos Jūsų klientų veiklos rezultatams.
STT.ai Enhanced priima kiekvieną formatą STT.ai palaiko: MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI ir kt. Išvesti kaip TXT, SRT, VTT, DOCX, JSON, arba PDF.
Taip. Garsiakalbio diarizacija veikia šalia STT.ai Enhanced kiekvienam transkripcija – kiekvienas garsiakalbis yra pažymėtas ir galite pervadinti juos redaktoriuje po to.
Taip. STT.ai Enhanced veikia mūsų privačioje infrastruktūroje – garso yra apdorojamas ir ištrintas pagal numatytąjį. Pro+ prideda kliento pusės šifravimo, todėl transkriptai yra neįskaitomi be jūsų rakto, ir Private Cloud leidžia jums savarankiškai STT.ai Enhanced visiškai savo VPC.
Naudokite palyginimo-stt įrankis paleisti STT.ai Enhanced prieš bet kurį kitą palaikomą modelį tame pačiame garso — pamatysite WER, segmentų skaičių, garsiakalbių etiketes ir pasitikėjimo balus šalia-by-by. STT.ai Enhanced palyginti Whisper didelis V3 yra dažniausiai paleisti.
Taip. Nurodykite "stt-ai-enhanced" kaip modelio parametrą /v1/tractor parametrą. Python ir Node.js SDK yra STT.ai Enhanced pavyzdžiai. Nemokama API pakopa apima 100 minučių/mėnesį.
Licenciją STT.ai Enhanced nustato STT.ai; savipriegloba priklauso nuo jų sąlygų. STT.ai įdiegta paslauga veikia STT.ai Enhanced valdomu GPU, todėl jums nereikia tvarkyti šios integracijos.