Bezmaksas AI Uzruna tekstam

Atšifrēt audio un video tekstu 100+ valodās. 10+ AI modeļus. Skaļruņa atklāšana. Pierakstīšanās nav nepieciešama.

9.3K
Transkripcija
235.9K
minūtes pārraidītas
100+
valodas
70+
brīvi instrumenti

Darbs ar publiski pieejamu audio un video. DRM aizsargāts saturs nav atbalstīts.

Uzlabot, lai uzlabotu
Private transcript
Tērzēšana ar transkriptu
Atslēgt ar Pro →
Nomest failu šeit vai noklikšķiniet, lai pārlūkotu
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM – līdz 2GB
Uzlabot, lai uzlabotu
Private transcript
Tērzēšana ar transkriptu
Atslēgt ar Pro →
Uzlabot, lai uzlabotu
Ierakstīšana: 0:00
Reālā laika Vosks (nepietiekams)
Pastiprināts Viskijs (precīzs)
Sabiedriskās saites: 24h, teksts · Pierakstīties 7d + audio · Pro privātām saitēm

Reālā laika runa uz tekstu. AI auto-korekcija, kad jūs runājat — precizitāte uzlabojas ar ilgāku runu.

Vispirms pārbaudiet mikrofonu
❤️ Mīlestība STT.ai? Pastāsti saviem draugiem!
Tu esi izmantojis savas brīvās transkripcijas

Pierakstīties bez maksas, lai saņemtu 600 minūtes / mēnesī, vai jauninājums neierobežotiem transkripcijas.

10 bezmaksas min./dienā 600 min bez pierakstīšanās Nav kredītkartes Šifrēts
Pierakstīties bez maksas →
Klienta Side šifrētā glabāšana — Jūsu transkripti ir šifrēti jūsu pārlūkprogrammā. Pat mēs nevaram tos izlasīt. Uzziniet, kā tas darbojas →

How STT.ai Works

Trīs soļi precīzai transkripcijai

1. Augšupielādēt, ierakstīt, vai Ielīmēt URL

Drag un nomest jebkuru audio vai video failu (MP3, WAV, MP4 un 20+ formāti). Ierakstiet no mikrofona reālajā laikā. Vai ielīmējiet saiti no YouTube, Vimeo, TikTok un 1300+ platformām.

2. AI atšifrē savu modeļa izvēli

Izvēlieties no 10+ AI modeļiem, tostarp Whisper, NVIDIA Canary (#1 precizitāte), un Mēnessine. Auto-detektēt valodu no 100+ opcijām. Skaļruņu diarizācija identificē, kurš teica, ko.

3. Eksportēt, Share, vai integrēt

Lejupielādēt kā TXT, SRT, VTT, DOCX, JSON, vai PDF. Dalīties, izmantojot saiti. Izmantojiet mūsu API, lai integrētu transkripciju jūsu lietotnē. Ideāli piemērots subtitriem, sanāksmes piezīmes, podcast, un vairāk.

100+
Valodas atbalstītas
70+
Brīvie rīki
1,300+
Platformas atbalstītas
7
Eksportēt formātus

Izstrādātājs- pirmais API

Integrēt runas uz tekstu savā app minūtēs. RESTful API ar reāllaika WebSocket straumēšanas.

REST + WebSocket — Failu augšupielāde un reālā laika straumēšana
Vairāki modeļi — Whisper, Kanāriju, Pastiprināts & vairāk
Skaļruņu diarizācija — Automātiski noteikt, kurš teica ko
Elastīga izvade — JSON, TXT, SRT, VTT ar vārdu laika nišām
import requests

response = requests.post(
    "https://api.stt.ai/v1/transcribe",
    headers={"Authorization": f"Bearer {API_KEY}"},
    files={"file": open("meeting.mp3", "rb")},
    data={
        "model": "large-v3-turbo",
        "language": "auto",
        "diarize": "true",
        "response_format": "json",
    },
)

result = response.json()
for seg in result["segments"]:
    print(f"{seg['speaker']}: {seg['text']}")

Gatavs translatoram?

Augšupielādēt savu pirmo failu bez maksas. Nav kredītkartes, nav pierakstīšanās. 600 minūtes mēnesī par bezmaksas plānu.

Sākt pārrakstīšanu

Bieži uzdoti jautājumi

speech to text runs in your browser: paste a URL, upload a file, or record from your mic. STT.ai picks the AI model and returns the transcript in under 5 minutes. Export as TXT, SRT, VTT, DOCX, JSON, or PDF.

Yes — every visitor gets 600 free minutes/month on STT.ai, usable for speech to text the same as any other workflow. Paid plans starting at $5/month unlock longer files, private transcripts, and priority queueing.

speech to text runs on the same AI models as the rest of STT.ai — our best models reach 95-97% accuracy on clean speech (3-5% Word Error Rate on benchmarks). Switch models on the fly if the first pass is below your target.

speech to text can run on any of STT.ai's 10+ models — STT.ai Enhanced (most accurate), Whisper Large V3 (99 languages), NVIDIA Canary (#1 WER on supported langs), Whisper Turbo (fast), Moonshine (lightweight), and more.

Yes. Every transcript exports as SRT or VTT — works with YouTube, Vimeo, TikTok, VLC, and every major video player. The burn-subtitles tool overlays them onto video as hardsubs.

Yes. Speaker diarization automatically labels each voice (Speaker 1, Speaker 2, ...) and you can rename them in the built-in editor. Works across all models and languages.

Most speech to text jobs finish in under 5 minutes. A 1-hour audio file typically completes in 2-3 minutes with our fastest models. Speed depends on chosen model and current GPU load.

speech to text accepts 20+ formats — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and more. Output to TXT, SRT, VTT, DOCX, JSON, or PDF.

Yes. Audio files submitted to speech to text are processed and deleted by default. Pro plans add client-side encryption — even if STT.ai's database is breached, your transcripts are unreadable without your key. Data is never used for model training without explicit opt-in.

Yes. STT.ai offers a REST API with Python and Node.js SDKs, plus an MCP server for Claude and Cursor — all usable for speech to text workflows. Free API tier includes 100 minutes/month.

Yes. Every transcript opens in the built-in editor where you can correct words, rename speakers, adjust timestamps, and add notes. All changes save automatically.

Every transcript gets a unique shareable URL. Export to DOCX or PDF for email. Pro plans add password-protected and permanent links — useful for client work.

STT.ai handles 1,300+ platforms including YouTube, Vimeo, TikTok, SoundCloud, Zoom, Google Meet, podcast hosts, and more. URL transcription works with publicly-available content only — DRM-protected sources can't be transcribed.