Transcribe with STT.ai Enhanced

Fungerer med offentligt tilgængelig lyd og video. DRM- beskyttet indhold understøttes ikke.

Opgradering til forbedret
Private transcript
Chat med udskrift
Lås op med Pro →
Slip fil her eller klik for at gennemse
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM ~ op til 2GB
Opgradering til forbedret
Private transcript
Chat med udskrift
Lås op med Pro →
Opgradering til forbedret
Registrering: 0:00
Realtid Vosk (øjeblikkelig)
Forbedret Hvisken (præcis)
Offentlige links: 24h, kun tekst · Tilmeld dig for 7d + lyd · Pro til private forbindelser

Real-time tale til tekst. AI auto-korrigerer som du taler nøjagtighed forbedrer med længere tale.

Test din mikrofon først
❤️ Love STT.ai? Fortæl dine venner!
Du har brugt dine gratis transskriptioner

Gratis tilmelding for at få 600 minutter/måned eller opgradering til ubegrænset transskription.

10 gratis min/dag 600 min fri med tilmelding Intet kreditkort Krypteret
Tilmeld dig gratis →
3.2%
WER
100
Languages
160.0x
Speed
Proprietary
License

About STT.ai Enhanced

✦ Unlock Enhanced Model

Get access to our most accurate model with any paid plan. 3.2% WER, 160x real-time speed, 100+ languages.

View Plans →
Model Info
  • ProviderSTT.ai
  • Architecture-
  • LicenseProprietary
  • UpdatedMar 2026

Ofte stillede spørgsmål

STT.ai Enhanced er en tale-til-tekst model af STT.ai. STT.ai værter STT.ai Enhanced på vores GPU-infrastruktur, så du kan bruge det uden at give din egen hardware uploade lyd eller video og vælge STT.ai Enhanced fra modelvælgeren.

På standard benchmarks, STT.ai Enhanced opnår omkring 3.2% Word Error Rate. Real-verden nøjagtighed afhænger af lydkvalitet, accent og sprog; for støjende eller accent optagelser, forventer et par procentpoint højere WER.

STT.ai Enhanced er en premium model, der er inkluderet med enhver betalt STT.ai plan starter på $5/måned. Gratis brugere kan få vist STT.ai Enhanced på korte klip; længere filer kræver en aktiv plan.

STT.ai Enhanced distribueres under Proprietary. STT.ai's hosted version håndterer licensoverholdelse for dig, så kommerciel brug gennem vores service er ligetil.

STT.ai Enhanced understøtter 100 sprog. Auto-detektering vælger det rigtige sprog til de fleste lyd; du kan også angive det manuelt for en lille nøjagtighed elevator.

STT.ai Enhanced behandler lyd på omkring 160.0x realtid på vores GPU'er. En 1-timers lydfil slutter på under 1 minutter; længere filer kø og underrette via e-mail, når det er gjort.

STT.ai Enhanced har 1.5B parametre. Større modeller har tendens til at være mere præcise, men langsommere; STT.ai værter STT.ai Enhanced på GPU, så parameteren tæller ikke påvirker din klient-side ydeevne.

STT.ai Enhanced accepterer hvert format STT.ai understøtter ~ MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, og andre. Output som TXT, SRT, VTT, DOCX, JSON, eller PDF.

Ja. Speaker diarization kører sammen med STT.ai Enhanced for hver transskription! hver højttaler er mærket, og du kan omdøbe dem i editoren bagefter.

Ja. STT.ai Enhanced kører i vores private infrastruktur ~ lyd behandles og slettes som standard. Pro + tilføjer klient-side kryptering, så udskrifter er ulæselige uden din nøgle, og Private Cloud lader dig selv-vært STT.ai Enhanced helt i din egen VPC.

Brug sammenligning-stt værktøj til at køre STT.ai Enhanced mod enhver anden understøttet model på den samme lyd! du vil se WER, segment tæller, højttaler etiketter, og tillid scorer side om side. STT.ai Enhanced vs Whisper Stor V3 sammenligning er den mest almindelige køre.

Ja. Angiv "stt-ai-enhanced" som modelparameter på /v1/transcribe endpoint. Python og node.js SDKs omfatter STT.ai Enhanced eksempler. Gratis API-niveau inkluderer 100 minutter/måned.

Licenser til STT.ai Enhanced er indstillet af STT.ai; selv-hosting afhænger af deres vilkår. STT.ai's hosted service kører STT.ai Enhanced på styret GPU, så du ikke behøver at håndtere denne integration.