Transcribe with STT.ai Enhanced
3.2%
WER
100
Languages
160.0x
Speed
Proprietary
License
About STT.ai Enhanced
✦ Unlock Enhanced Model
Get access to our most accurate model with any paid plan. 3.2% WER, 160x real-time speed, 100+ languages.
View Plans →Model Info
- ProviderSTT.ai
- Architecture-
- LicenseProprietary
- UpdatedMar 2026
Veelgestelde vragen
STT.ai Enhanced is een speech-to-text model van STT.ai. STT.ai hosts STT.ai Enhanced op onze GPU-infrastructuur, zodat u het kunt gebruiken zonder het voorzien van uw eigen hardware te uploaden audio of video en kies STT.ai Enhanced uit de model picker.
Op standaard benchmarks bereikt STT.ai Enhanced ongeveer 3.2% Word Error Rate. Real-world nauwkeurigheid is afhankelijk van audiokwaliteit, accent en taal; voor lawaaierige of geaccentueerde opnames, verwachten een paar procentpunten hoger WER.
STT.ai Enhanced is een premium model inbegrepen met een betaalde STT.ai plan vanaf $5/maand. Gratis gebruikers kunnen een voorbeeld STT.ai Enhanced op korte clips; langere bestanden vereisen een actief plan.
STT.ai Enhanced wordt gedistribueerd onder Proprietary. STT.ai's gehoste versie behandelt de licentie compliance voor u, zodat commercieel gebruik via onze service is eenvoudig.
STT.ai Enhanced ondersteunt 100 talen. Autodetectie kiest de juiste taal voor de meeste audio; u kunt het ook handmatig specificeren voor een kleine nauwkeurigheid lift.
STT.ai Enhanced verwerkt audio op ongeveer 160.0x real-time op onze GPU's. Een 1-uurs audiobestand eindigt in minder dan 1 minuten; langere files wachtrij en melding per e-mail wanneer gedaan.
STT.ai Enhanced heeft 1.5B parameters. Grotere modellen hebben de neiging om nauwkeuriger maar langzamer te zijn; STT.ai hosts STT.ai Enhanced op GPU zodat de parametertelling geen invloed heeft op de prestaties van uw client-side.
STT.ai Enhanced accepteert elk formaat dat STT.ai ondersteunt. MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, en anderen. Output als TXT, SRT, VTT, DOCX, JSON, of PDF.
Ja. Speaker diarization loopt naast STT.ai Enhanced voor elke transcriptie • elke speaker is gelabeld en je kunt ze hernoemen in de editor achteraf.
Ja. STT.ai Enhanced draait in onze privé-infrastructuur audio wordt verwerkt en verwijderd standaard. Pro+ voegt client-side encryptie zodat transcripten zijn onleesbaar zonder uw sleutel, en Private Cloud kunt u zelf-host STT.ai Enhanced volledig in uw eigen VPC.
Gebruik de compare-stt tool om STT.ai Enhanced uit te voeren tegen elk ander ondersteund model op dezelfde audio, zie je WER, segment count, speaker labels, en vertrouwen scoort side-by-side. De STT.ai Enhanced vs Whisper Large V3 vergelijking is de meest voorkomende run.
Ja. Geef "stt-ai-enhanced" op als de modelparameter op het /v1/transcribe eindpunt. Python en Node.js SDK's bevatten STT.ai Enhanced voorbeelden. Gratis API tier bevat 100 minuten/maand.
Licentie voor STT.ai Enhanced is ingesteld door STT.ai; self-hosting hangt af van hun voorwaarden. STT.ai's gehoste service draait STT.ai Enhanced op beheerde GPU, zodat u niet hoeft om te gaan met die integratie.