Bezmaksas runas par tekstu tiešsaistē
Pārvērst runu uz tekstu ar AI-motored transkripcija. Uzlādēt audio failus, ierakstu no mikrofona, vai ielīmēt URL. 100+ valodas, 10+ modeļi, 98%+ precizitāte.
1. Augšupielādēt runas ierakstu
Augšupielādēt audio vai video failu, ielīmēt URL, vai ierakstīt runu no jūsu mic.
2. AI konvertē runu uz tekstu
Izvēlieties no 10+ AI modeļiem. Iekļauta skaļrunis un valodas auto- detektēšana.
3. Eksportēt savu transkripciju
Lejupielādēt 6 formātos. Dalīties transkripta saites ar audio atskaņošanu.
Uzruna teksta paraugos
Izvēlieties AI modeli, kas atbilst jūsu vajadzībām, vai arī izvēlēsimies labāko.
Valoda uz tekstu 100+ valodās
Uzruna teksta lietošanā
Gatavs pārvērst runu uz tekstu?
Sākt bez maksas →Bieži uzdoti jautājumi
Uzruna uz tekstu (saukta arī par runas atpazīšanu vai ASR) pārvērš runāto audio uz rakstītiem vārdiem automātiski. STT.ai veic jūsu ierakstu, izmantojot AI modeli, kas klausās audio un izvades rediģējamo tekstu ar laika zīmju un skaļruņu etiķetes — nav nepieciešama rakstīšana.
Audioustic modelis kartē skaņas viļņu formu uz fonēmu, tad valodas modelis apkopo tos visticamākajos vārdos un pieturvietā. STT.ai to dara GPU ar modeļiem, piemēram, Whisper Lielā V3 un NVIDIA Canary, tāpēc vienu stundu ierakstu parasti veic 2-3 minūtēs.
Jā. Katrs apmeklētājs saņem 600 bezmaksas minūtes mēnesī bez pierakstīšanās nepieciešama jūsu pirmajam failam. Apmaksātie plāni sākas ar $5/mēnesi un pievieno ilgākus failus, privātus transkriptus un prioritātes apstrādi.
On clean speech our best models reach 95-97% accuracy (a 3-5% Word Error Rate on benchmarks). Accuracy drops with background noise, heavy accents, crosstalk, or low-bitrate audio — using a decent microphone and a quiet room makes the biggest difference.
Yes. Speak into your microphone and STT.ai streams the transcript live via the live-transcription tool. You can also upload a finished recording for batch transcription if you don't need it word-by-word as you talk.
STT.ai recognizes 100+ languages and auto-detects the spoken language for most audio. You can also set the language manually for a small accuracy lift, and mixed-language recordings are handled by switching mid-clip.
Yes. Speaker diarization labels each voice (Speaker 1, Speaker 2, ...) and you can rename them in the editor. This works across every supported model and language.
STT.ai accepts 20+ formats including MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, and AVI. Output to TXT, SRT, VTT, DOCX, JSON, or PDF.
Speech to text transcribes WHAT was said into words; voice recognition (speaker identification) determines WHO said it. STT.ai does both — transcription plus speaker diarization — but the terms describe different tasks.
Yes. Audio is processed and deleted by default. Pro plans add client-side encryption so transcripts are unreadable without your key, even to STT.ai, and your data is never used for model training without explicit opt-in.
Yes. STT.ai has a REST API with Python and Node.js SDKs plus an MCP server for Claude and Cursor. The free API tier includes 100 minutes/month, with per-second billing beyond that.
Yes. Every transcript opens in a built-in editor where you can fix misheard words, rename speakers, adjust timestamps, and add notes. Edits persist across every export format.