Transcribe with STT.ai Enhanced
3.2%
WER
100
Languages
160.0x
Speed
Proprietary
License
About STT.ai Enhanced
✦ Unlock Enhanced Model
Get access to our most accurate model with any paid plan. 3.2% WER, 160x real-time speed, 100+ languages.
View Plans →Model Info
- ProviderSTT.ai
- Architecture-
- LicenseProprietary
- UpdatedMar 2026
Ofte stilte spørsmål
STT.ai Enhanced er en tale-til-tekst-modell av STT.ai. STT.ai er verter STT.ai Enhanced på vår GPU-infrastruktur slik at du kan bruke den uten å skaffe til veie din egen maskinvare – last opp lyd eller video og velg STT.ai Enhanced fra modellvelgeren.
Med standard standardverdier oppnår 88 000 omtrent 3.2% ordfeilrate. Nøyaktighet i den virkelige verden avhenger av lydkvalitet, aksent og språk. For opptak med støy eller aksent, forvent noen prosentpoeng høyere WER.
STT.ai Enhanced er en premiummodell – inkludert med enhver betalt STT.ai plan som begynner på $ 5 per måned. Gratis brukere kan forhåndsvise STT.ai Enhanced på kortklipp, lengre filer krever en aktiv plan.
STT.ai Enhanced er distribuert under Proprietary.STT.ais vertsversjon håndterer lisenslydnad for dere så kommersiell bruk gjennom vår tjeneste er grei.
STT.ai Enhanced støtter 100 språk. Auto- deteksjon velger det riktige språket for de fleste lydene. Du kan også oppgi det manuelt for en liten presisjonsheis.
STT.ai Enhanced behandler lyd ved omlag 160.0x i sanntid på våre GPU- er. En en- times lydfil er ferdig på under 1 minutter, lengre filkø og varsles med e- post når den er ferdig.
STT.ai Enhanced har 1.5B parametre. Større modeller har en tendens til å være mer presise men langsommere. STT.ai er verter STT.ai Enhanced på GPU så parametertallet påvirker ikke din ytelse på klientsiden.
STT.ai Enhanced godtar alle format STT.ai støtter – MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI og andre. Utdata som TXT, SRT, VTT, DOCX, JSON eller PDF.
Ja. Høytalerdiarisering går sammen med STT.ai Enhanced for hver utskrift – hver høyttaler er merket og du kan endre navn på dem i redigeringen etterpå.
Ja. STT.ai Enhanced kjører i vår private infrastruktur – lyd behandles og slettes som standard. Pro+ legger til kryptering på klientsiden slik at utskrifter er uleselige uten din nøkkel, og Private Cloud lar deg bruke selvtjener STT.ai Enhanced helt i din egen VPC.
Bruk sammenlikningsverktøyet til å kjøre STT.ai Enhanced mot alle andre modeller som støttes på samme lyd – du får se WER, segmenttelling, høyttal og tillitspoeng side om side. Sammenlikningen STT.ai Enhanced mot Whisper Stor V3 er det vanligste kjøreverktøyet.
Ja. Oppgi « stt-ai-enhanced » som modellparameter for sluttpunktet / v1/ trancribe. Python og Node. js SDK inkluderer STT.ai Enhanced eksempler. Free API- nivå inkluderer 100 minutter/ måned.
Lisens for STT.ai Enhanced er satt til STT.ai; selvvært avhenger av deres vilkår. STT.ais vertstjeneste kjører STT.ai Enhanced på håndtert GPU slik at du ikke trenger å håndtere den integreringen.