Перацягвайце і скідвайце любы аўдыё- ці відэафайл (MP3, WAV, MP4 і больш за 20 фарматаў). Запісвайце з мікрафона ў рэальным часе. Або ўстаўце спасылку з YouTube, Vimeo, TikTok і больш за 1300 іншых плятформ.

2. AI перапісвае з вашым выбарам мадэлі

Выбірайце з 10+ мадэляў машыннага навучаньня, уключаючы Whisper, NVIDIA Canary (#1 дакладнасьць) і Moonshine. Аўтаматычнае вызначэньне мовы з 100+ варыянтаў. Дыярызацыя гаворкі вызначае, хто што сказаў.

3. Экспарт, абмен або інтэграцыя

Сцягнуць як TXT, SRT, VTT, DOCX, JSON або PDF. Падзяліцца праз спасылку. Выкарыстоўвайце наш API для інтэграцыі транскрыпцыі ў вашу праграму. Ідэальна падыходзіць для субтытраў, заметак на сустрэчах, падкастаў і іншага.

Папулярныя выпадкі выкарыстання

Усе выпадкі выкарыстання →

Сустрэча

Заметкі сустрэчы і дзеянні@ info: whatsthis

Бяспечная транскрыпцыя

Прачытаць

Заметкі і даведнікі па вывучэнніName

Ліга

& Стварыць

Усё, што вам трэба для аўдыё і відэа

70+ бясплатных інструментаў, якія працуюць на AI

Праграма пераўтварэння мовы ў тэкстName

Перапісваць аўдыё- і відэафайлы

Транскрипция в реальном времени

Транскрипция микрофона в реальном времени

Транскрипты YouTube

Выцягнуць субтытры з любога відэа

Рэдактар субтытраў

Рэдагаваньне файлаў SRT і VTT у інтэрнэце

Выдаліць шум

Выдаліць фонавы шум з гуку

Аудыа канвэртарName

MP3, WAV, FLAC, OGG, AAC і іншыя

Выдаленне вока

Ізаляваць ці выдаліць воклічы

Аўдыё- абрэз

Выразаць і абрэзаць аўдыёфайлы

Канвэртар падпіскі

Фарматы SRT, VTT, SSA, SBV

Пратакол сустрэчы

Выдаліць элементы дзеянняў

З тэксту ў мовуName

Ператварэнне тэксту ў натуральную мову

Перакладчык субтытраўName

Пераклад субтытраў на 100+ моваў

Праглядзець усе 70+ інструментаў →

100+

Падтрымліваемыя мовы

70+

Свабодныя інструменты

1,300+

Падтрымліваемыя платформы

Фарматы экспарту

API для распрацоўшчыкаў

Інтэграцыя пераўтварэньня мовы ў тэкст у вашыя праграмы за некалькі хвілін. RESTful API з WebSocket-трансляцыяй у рэальным часе.

REST + WebSocket — Загрузка файлаў і стрымінг у рэальным часе

Некалькі мадэляў — Whisper, Canary, пашыраны і іншыя

Дыялагічны дынамік — Аўтаматычнае выяўленне, хто што сказаў

Вывад — JSON, TXT, SRT, VTT з часовымі штампамі словаў

Дакументацыя API Ігральная пляцоўка

import requests

response = requests.post(
    "https://api.stt.ai/v1/transcribe",
    headers={"Authorization": f"Bearer {API_KEY}"},
    files={"file": open("meeting.mp3", "rb")},
    data={
        "model": "large-v3-turbo",
        "language": "auto",
        "diarize": "true",
        "response_format": "json",
    },
)

result = response.json()
for seg in result["segments"]:
    print(f"{seg['speaker']}: {seg['text']}")

import fs from "fs";

const form = new FormData();
form.append("file", fs.createReadStream("meeting.mp3"));
form.append("model", "large-v3-turbo");
form.append("language", "auto");
form.append("diarize", "true");

const res = await fetch("https://api.stt.ai/v1/transcribe", {
  method: "POST",
  headers: { Authorization: `Bearer ${API_KEY}` },
  body: form,
});

const { segments } = await res.json();
segments.forEach(s =>
  console.log(`${s.speaker}: ${s.text}`)
);

Пераключыцца з іншай службы маўлення на тэкставую?

STT.ai vs Otter.ai STT.ai vs TurboScribe STT.ai vs Fireflies STT.ai vs Rev Параўнаць усе →

Простая, праглядная цана

Пачынаць можна бясплатна. Павялічваць памеры можна па меры росту.

Вольна

$0/месяцаў

600 хвілін/ месяц

Мовы
Экспартаваць TXT і SRT
Даступ да API

Старт

$9/месяцаў

3000 хвілін/ месяц

100+ моў
Усе мадэлі
Усе фарматы экспарту

Прыватныя транскрыпты
Неабмежаваная колькасць месцаў у камандзе
Прыярытэтная апрацоўка

Бізнес

$39/месяцаў

20, 000 хвілін/ месяц

Усё ў Pro
50 Кб мін. захоўвання
Неабмежаваная гутарка з AI

Паказаць усе планы і цэны →

Падтрымліваемыя мовы

Усе 100+ моў →

English Spanish French German Japanese Chinese Arabic Hindi Portuguese Russian Korean Italian Turkish Dutch Polish +85 больш

Вы гатовыя да перапіскі?

Загрузіце свой першы файл бясплатна. Без крэдытнай карты, без рэгістрацыі. 600 хвілін у месяц па бясплатным плане.

Пачаць перапіску

Часта задаваемыя пытанні

speech to text runs in your browser: paste a URL, upload a file, or record from your mic. STT.ai picks the AI model and returns the transcript in under 5 minutes. Export as TXT, SRT, VTT, DOCX, JSON, or PDF.

Yes — every visitor gets 600 free minutes/month on STT.ai, usable for speech to text the same as any other workflow. Paid plans starting at $5/month unlock longer files, private transcripts, and priority queueing.

speech to text runs on the same AI models as the rest of STT.ai — our best models reach 95-97% accuracy on clean speech (3-5% Word Error Rate on benchmarks). Switch models on the fly if the first pass is below your target.

speech to text can run on any of STT.ai's 10+ models — STT.ai Enhanced (most accurate), Whisper Large V3 (99 languages), NVIDIA Canary (#1 WER on supported langs), Whisper Turbo (fast), Moonshine (lightweight), and more.

Yes. Every transcript exports as SRT or VTT — works with YouTube, Vimeo, TikTok, VLC, and every major video player. The burn-subtitles tool overlays them onto video as hardsubs.

Yes. Speaker diarization automatically labels each voice (Speaker 1, Speaker 2, ...) and you can rename them in the built-in editor. Works across all models and languages.

Most speech to text jobs finish in under 5 minutes. A 1-hour audio file typically completes in 2-3 minutes with our fastest models. Speed depends on chosen model and current GPU load.

speech to text accepts 20+ formats — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and more. Output to TXT, SRT, VTT, DOCX, JSON, or PDF.

Yes. Audio files submitted to speech to text are processed and deleted by default. Pro plans add client-side encryption — even if STT.ai's database is breached, your transcripts are unreadable without your key. Data is never used for model training without explicit opt-in.

Yes. STT.ai offers a REST API with Python and Node.js SDKs, plus an MCP server for Claude and Cursor — all usable for speech to text workflows. Free API tier includes 100 minutes/month.

Yes. Every transcript opens in the built-in editor where you can correct words, rename speakers, adjust timestamps, and add notes. All changes save automatically.

Every transcript gets a unique shareable URL. Export to DOCX or PDF for email. Pro plans add password-protected and permanent links — useful for client work.

STT.ai handles 1,300+ platforms including YouTube, Vimeo, TikTok, SoundCloud, Zoom, Google Meet, podcast hosts, and more. URL transcription works with publicly-available content only — DRM-protected sources can't be transcribed.

Свабодны AI Праграма пераўтварэння мовы ў тэкстName

Модулі пераўтварэння мовы ў тэкстName

STT.ai працоўных месцаў.

1. Загрузіць, запісаць або ўставіць URL

2. AI перапісвае з вашым выбарам мадэлі

3. Экспарт, абмен або інтэграцыя

Папулярныя выпадкі выкарыстання

Усё, што вам трэба для аўдыё і відэа

API для распрацоўшчыкаў

Простая, праглядная цана

Падтрымліваемыя мовы

Вы гатовыя да перапіскі?

Часта задаваемыя пытанні

How does speech to text work on STT.ai?

Is speech to text free?

How accurate is speech to text?

What AI models can I use for speech to text?

Can I get subtitles from speech to text?

Does speech to text detect different speakers?

How long does speech to text take?

What input formats does speech to text support?

Is my audio private when I use speech to text?

Is there a speech to text API?

Can I edit a speech to text transcript after?

How do I share what speech to text produces?

What other platforms work beyond speech to text?