Drag un nomest jebkuru audio vai video failu (MP3, WAV, MP4 un 20+ formāti). Ierakstiet no mikrofona reālajā laikā. Vai ielīmējiet saiti no YouTube, Vimeo, TikTok un 1300+ platformām.

2. AI atšifrē savu modeļa izvēli

Izvēlieties no 10+ AI modeļiem, tostarp Whisper, NVIDIA Canary (#1 precizitāte), un Mēnessine. Auto-detektēt valodu no 100+ opcijām. Skaļruņu diarizācija identificē, kurš teica, ko.

3. Eksportēt, Share, vai integrēt

Lejupielādēt kā TXT, SRT, VTT, DOCX, JSON, vai PDF. Dalīties, izmantojot saiti. Izmantojiet mūsu API, lai integrētu transkripciju jūsu lietotnē. Ideāli piemērots subtitriem, sanāksmes piezīmes, podcast, un vairāk.

Populāras lietošanas gadījumi

Visi lietošanas gadījumi →

Sanāksmes

Sanāksmes piezīmes un rīcības jautājumi

Podraides

Atkļūdošanas un parādīšanas piezīmes

Klases piezīmes un pētījumu rokasgrāmatas

Juridiskais

Noguldījumi un tiesa

Viss, kas jums nepieciešams audio un video

70+ bezmaksas instrumenti, ko darbina AI

Uzruna tekstam

Atšifrēt audio un video failus

Dzīva transkripcija

Reālā laika mikrofona transkripcija

YouTube transkripti

Izņemt parakstus no jebkura videoklipa

Apakšvirsrakstu redaktors

Rediģēt SRT & VTT failus tiešsaistē

Trokšņa noņēmējs

Noņemt fona troksni no audio

Audio pārveidotājs

MP3, WAV, FLAC, OGG, AAC & vairāk

Voka noņēmējs

Izolējiet vokālus vai noņemiet tos

Audio trimmersName

Izgriezt un izgriezt audio failus

Virsraksta pārveidotājs

SRT, VTT, SSA, SBV formāti

Sēdes protokols

Atspiest darbības vienības un kopsavilkumus

Teksts uz runu

Pārveidot tekstu uz dabisku runu

Apakšvirsrakstu tulkotājs

Tulkot subtitrus uz 100+ valodām

Skatīt visus 70+ rīkus →

100+

Valodas atbalstītas

70+

Brīvie rīki

1,300+

Platformas atbalstītas

Eksportēt formātus

Izstrādātājs- pirmais API

Integrēt runas uz tekstu savā app minūtēs. RESTful API ar reāllaika WebSocket straumēšanas.

REST + WebSocket — Failu augšupielāde un reālā laika straumēšana

Vairāki modeļi — Whisper, Kanāriju, Pastiprināts & vairāk

Skaļruņu diarizācija — Automātiski noteikt, kurš teica ko

Elastīga izvade — JSON, TXT, SRT, VTT ar vārdu laika nišām

API dokumenti Spēļu laukums

import requests

response = requests.post(
    "https://api.stt.ai/v1/transcribe",
    headers={"Authorization": f"Bearer {API_KEY}"},
    files={"file": open("meeting.mp3", "rb")},
    data={
        "model": "large-v3-turbo",
        "language": "auto",
        "diarize": "true",
        "response_format": "json",
    },
)

result = response.json()
for seg in result["segments"]:
    print(f"{seg['speaker']}: {seg['text']}")

import fs from "fs";

const form = new FormData();
form.append("file", fs.createReadStream("meeting.mp3"));
form.append("model", "large-v3-turbo");
form.append("language", "auto");
form.append("diarize", "true");

const res = await fetch("https://api.stt.ai/v1/transcribe", {
  method: "POST",
  headers: { Authorization: `Bearer ${API_KEY}` },
  body: form,
});

const { segments } = await res.json();
segments.forEach(s =>
  console.log(`${s.speaker}: ${s.text}`)
);

Pāreja no citas runas uz īsziņu servisu?

STT.ai vs Otter.ai STT.ai vs TurboScribe STT.ai vs Fireflies STT.ai vs Rev Salīdzināt visus →

Vienkārša, pārredzama cenu noteikšana

Sākt bez maksas. Scale kā jūs augt.

Bezmaksas

$0/s ta

600 min./mēnesī

5 valodas
TXT & SRT eksports
API piekļuve

Palaist

$9/s ta

3 000 min/mēnesī

100+ valodas
Visi AI modeļi
Visi eksporta formāti

MOST POPULĀLS

Pro

$19/s ta

7500 min/mēnesī

Privātie transkripti
Neierobežots komandas sēdeklis
Prioritārā apstrāde

Bizness

$39/s ta

20 000 min/mēnesī

Viss Pro
50K min. uzglabāšana
Neierobežota AI tērzēšana

Skatīt visus plānus un cenu →

Atbalstītās valodas

Visas 100+ valodas →

English Spanish French German Japanese Chinese Arabic Hindi Portuguese Russian Korean Italian Turkish Dutch Polish +85 vairāk

Gatavs translatoram?

Augšupielādēt savu pirmo failu bez maksas. Nav kredītkartes, nav pierakstīšanās. 600 minūtes mēnesī par bezmaksas plānu.

Sākt pārrakstīšanu

Bieži uzdoti jautājumi

speech to text runs in your browser: paste a URL, upload a file, or record from your mic. STT.ai picks the AI model and returns the transcript in under 5 minutes. Export as TXT, SRT, VTT, DOCX, JSON, or PDF.

Yes — every visitor gets 600 free minutes/month on STT.ai, usable for speech to text the same as any other workflow. Paid plans starting at $5/month unlock longer files, private transcripts, and priority queueing.

speech to text runs on the same AI models as the rest of STT.ai — our best models reach 95-97% accuracy on clean speech (3-5% Word Error Rate on benchmarks). Switch models on the fly if the first pass is below your target.

speech to text can run on any of STT.ai's 10+ models — STT.ai Enhanced (most accurate), Whisper Large V3 (99 languages), NVIDIA Canary (#1 WER on supported langs), Whisper Turbo (fast), Moonshine (lightweight), and more.

Yes. Every transcript exports as SRT or VTT — works with YouTube, Vimeo, TikTok, VLC, and every major video player. The burn-subtitles tool overlays them onto video as hardsubs.

Yes. Speaker diarization automatically labels each voice (Speaker 1, Speaker 2, ...) and you can rename them in the built-in editor. Works across all models and languages.

Most speech to text jobs finish in under 5 minutes. A 1-hour audio file typically completes in 2-3 minutes with our fastest models. Speed depends on chosen model and current GPU load.

speech to text accepts 20+ formats — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and more. Output to TXT, SRT, VTT, DOCX, JSON, or PDF.

Yes. Audio files submitted to speech to text are processed and deleted by default. Pro plans add client-side encryption — even if STT.ai's database is breached, your transcripts are unreadable without your key. Data is never used for model training without explicit opt-in.

Yes. STT.ai offers a REST API with Python and Node.js SDKs, plus an MCP server for Claude and Cursor — all usable for speech to text workflows. Free API tier includes 100 minutes/month.

Yes. Every transcript opens in the built-in editor where you can correct words, rename speakers, adjust timestamps, and add notes. All changes save automatically.

Every transcript gets a unique shareable URL. Export to DOCX or PDF for email. Pro plans add password-protected and permanent links — useful for client work.

STT.ai handles 1,300+ platforms including YouTube, Vimeo, TikTok, SoundCloud, Zoom, Google Meet, podcast hosts, and more. URL transcription works with publicly-available content only — DRM-protected sources can't be transcribed.

Bezmaksas AI Uzruna tekstam

Uzruna teksta paraugos

How STT.ai Works

1. Augšupielādēt, ierakstīt, vai Ielīmēt URL

2. AI atšifrē savu modeļa izvēli

3. Eksportēt, Share, vai integrēt

Populāras lietošanas gadījumi

Viss, kas jums nepieciešams audio un video

Izstrādātājs- pirmais API

Vienkārša, pārredzama cenu noteikšana

Atbalstītās valodas

Gatavs translatoram?

Bieži uzdoti jautājumi

How does speech to text work on STT.ai?

Is speech to text free?

How accurate is speech to text?

What AI models can I use for speech to text?

Can I get subtitles from speech to text?

Does speech to text detect different speakers?

How long does speech to text take?

What input formats does speech to text support?

Is my audio private when I use speech to text?

Is there a speech to text API?

Can I edit a speech to text transcript after?

How do I share what speech to text produces?

What other platforms work beyond speech to text?