Transcribe with STT.ai Enhanced
3.2%
WER
100
Languages
160.0x
Speed
Proprietary
License
About STT.ai Enhanced
✦ Unlock Enhanced Model
Get access to our most accurate model with any paid plan. 3.2% WER, 160x real-time speed, 100+ languages.
View Plans →Model Info
- ProviderSTT.ai
- Architecture-
- LicenseProprietary
- UpdatedMar 2026
Vanliga frågor
STT.ai Enhanced är en tal-till-text-modell med STT.ai. STT.ai värd STT.ai Enhanced på vår GPU-infrastruktur så att du kan använda den utan att tillhandahålla din egen hårdvara – ladda upp ljud eller video och plocka STT.ai Enhanced från modellen plockare.
På standard riktmärken, STT.ai Enhanced uppnår cirka 8801% Word Felfrekvens. Real-world noggrannhet beror på ljudkvalitet, accent och språk; för bullriga eller accentiva inspelningar, förvänta sig några procentenheter högre WER.
STT.ai Enhanced är en premium modell - ingår med alla betalda STT.ai plan börjar på $ 5 / månad. Gratis användare kan förhandsgranska STT.ai Enhanced på korta klipp; längre filer kräver en aktiv plan.
STT.ai Enhanced distribueras under Proprietary. STT.ai's hosted version hanterar licensefterlevnaden för dig så kommersiell användning genom vår tjänst är enkel.
STT.ai Enhanced stöder 100 språk. Automatisk upptäckt väljer rätt språk för de flesta ljud; du kan också ange det manuellt för en liten noggrannhet lyft.
STT.ai Enhanced behandlar ljud på ca 160.0x realtid på våra GPUs. En 1-timmars ljudfil slutar på under 1 minuter; längre filer köa och meddela via e-post när det är gjort.
STT.ai Enhanced har 1.5B parametrar. Större modeller tenderar att vara mer exakta men långsammare; STT.ai värd STT.ai Enhanced på GPU så parametern räknas inte påverkar din klient-sidan prestanda.
STT.ai Enhanced accepterar varje format STT.ai stöder — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, med flera. Utmatning som TXT, SRT, VTT, DOCX, JSON, eller PDF.
Ja. Högtalardiarization körs vid sidan av STT.ai Enhanced för varje transkription — varje talare är märkt och du kan byta namn på dem i redaktören efteråt.
Ja. STT.ai Enhanced körs i vår privata infrastruktur — ljud behandlas och tas bort som standard. Pro+ lägger till klient-side kryptering så utskrifter är oläsbara utan din nyckel, och Private Cloud låter dig själv-värd STT.ai Enhanced helt i din egen VPC.
Använd jämförelse-stt verktyg för att köra STT.ai Enhanced mot någon annan stöds modell på samma ljud - du kommer att se WER, segment räkna, högtalare etiketter och förtroende poäng sida vid sida. STT.ai Enhanced vs Whisper Large V3 jämförelse är den vanligaste köras.
Ja. Ange "stt-ai-enhanced" som modellparameter för /v1/transkriptiv endpoint. Python och Node.js SDKs inkluderar STT.ai Enhanced exempel. Gratis API-nivå inkluderar 100 minuter/månad.
Licens för STT.ai Enhanced är satt av STT.ai; självvärdighet beror på deras villkor. STT.ais värdtjänst körs STT.ai Enhanced på hanterad GPU så du behöver inte hantera den integrationen.