Transcribe with STT.ai Enhanced

Fungerer med offentleg tilgjengeleg lyd og video. DRM-verna innhald er ikkje støtta.

Oppgrader til utvida
Private transcript
Prate med transkripsjon
Lås opp med Pro →
Slepp fil her eller trykk for å bla
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — opptil 2 GB
Oppgrader til utvida
Private transcript
Prate med transkripsjon
Lås opp med Pro →
Oppgrader til utvida
Opptak: 0:00
Sanntids Voks (instant)
Forbetra Whisper (nøyaktig)
Offentlege lenkjer: 24h, berre tekst · Meld deg på for 7d + audio · Pro for private lenkjer

Tale til tekst i sanntid. AI korrigerer automatisk når du snakkar — nøyaktigheita aukar med lengre tale.

Test mikrofonen først
❤️ Elskar du STT.ai? Fortel vennene dine!
Du har brukt opp dei frie transkripsjonane dine

Registrer deg gratis for å få 600 minutt/månad, eller oppgrader for ubegrenset transkripsjon.

10 ledig min/dag 600 min gratis ved påmelding Ingen kredittkort Kryptert
Meld deg på gratis →
3.2%
WER
100
Languages
160.0x
Speed
Proprietary
License

About STT.ai Enhanced

✦ Unlock Enhanced Model

Get access to our most accurate model with any paid plan. 3.2% WER, 160x real-time speed, 100+ languages.

View Plans →
Model Info
  • ProviderSTT.ai
  • Architecture-
  • LicenseProprietary
  • UpdatedMar 2026

Ofte stilte spørsmål

STT.ai Enhanced er ein tale-til-tekst-modell frå STT.ai. STT.ai er vert for STT.ai Enhanced på vår GPU-infrastruktur, slik at du kan bruka han utan å ha din eigen maskinvare — last opp lyd eller video og vel STT.ai Enhanced frå modellveljaren.

På standard målestokkar oppnår STT.ai Enhanced om lag 3.2% ordfeilrate. Nøyaktigheita i verkeleg liv avheng av lydkvalitet, aksent og språk. For støyande eller aksenterte opptak, kan du venta eit par prosentpoeng høgare WER.

STT.ai Enhanced er ein premiummodell — inkludert i alle betalte STT.ai-planar frå $5/månad. Gratisbrukarar kan førehandsvise STT.ai Enhanced på korte klipp. Lengre filer krev eit aktivt abonnement.

STT.ai Enhanced er distribuert under Proprietary. STT.ai sin vertsversjon handterer lisenssamsvar for deg, slik at kommersiell bruk gjennom tenesta vår er enkel.

STT.ai Enhanced støttar 100 språk. Automatisk oppdaging vel det rette språket for dei fleste lydfiler. Du kan òg velja språket manuelt for å få ein liten forbetring av nøyaktigheita.

STT.ai Enhanced prosesserer lyd med om lag 160.0x sanntid på grafikkprosessorane våre. Ein 1-timers lydfil er ferdig på under 1 minutt. Lengre filer vert lagt i kø og varsla via e-post når dei er ferdige.

STT.ai Enhanced har 1.5B-parametrar. Større modeller har ein tendens til å vera meir nøyaktige, men tregare. STT.ai er vert for STT.ai Enhanced på GPU-en, så parametertalet påverkar ikkje ytinga på klientsida.

STT.ai Enhanced godtek alle formata STT.ai støttar — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI og andre. Utdata som TXT, SRT, VTT, DOCX, JSON eller PDF.

Ja. Diarisering av talarar køyrer saman med STT.ai Enhanced for kvar transkripsjon — kvar talar er merket og du kan endra namnet på dei i redigeringa etterpå.

Ja. STT.ai Enhanced køyrer i vår private infrastruktur – lyd blir handsama og sletta som standard. Pro+ legg til kryptering på klientsida slik at transkripsjonar er uleselege utan nøkkelen din, og Private Cloud let deg vere vert for STT.ai Enhanced heilt i din eigen VPC.

Bruk verktøyet compare-stt for å køyra STT.ai Enhanced mot ein annan støtta modell på same lyd. Du vil sjå WER, segmenttal, høgtalarnamn og tiltrupoeng side om side. Samanlikninga STT.ai Enhanced vs Whisper Large V3 er den mest brukte.

Ja. Oppgje «stt-ai-enhanced» som modellparameter på /v1/transcribe-endepunktet. Python- og Node.js-SDK-ar inneheld STT.ai Enhanced-eksempela. Gratis API-nivå inkluderer 100 minutt/månad.

Lisensar for STT.ai Enhanced vert sett av STT.ai. Sjølv-hosting avheng av vilkåra deira. STT.ai sin vertsteneste køyrer STT.ai Enhanced på administrert GPU, så du treng ikkje handtera denne integrasjonen.