Ҳар қандай аудио ёки видео файлни (MP3, WAV, MP4 ва 20+ форматлар) олиб ташланг. Микрофонингиздан реал вақтда ёзиб олинг. Ёки YouTube, Vimeo, TikTok ва 1300+ платформалардан ҳаволаларни жойланг.

2. AI сиз танлаган модел билан ёзади

Whisper, NVIDIA Canary (#1 accuracy) ва Moonshine каби 10+ AI моделларидан танланг. 100+ вариантлардан тилни автоматик аниқлаш. Сўзловчи диаризацияси ким нимани айтганини аниқлаш.

3. Экспорт қилиш, Улушлаш ёки Бирлаштириш

TXT, SRT, VTT, DOCX, JSON ёки PDF шаклида юклаб олинг. Уни ҳавола орқали ўртоқлашинг. Бизнинг API'дан фойдаланиб, транскрипцияни дастурингизга интеграция қилинг. Субтитрлар, йиғилиш ёзувлари, подкастлар ва бошқалар учун жуда яхши.

Кўп қўлланиладиган ҳолатлар

Ҳамма ишлатмалар →

Йиғилишлари

Йиғилишда ёзувлар ва ҳаракатлар

Класс ёзувлари ва ўқув йўлланмалари

Юрисдик

Депозитлар

Аудио ва видео учун керак бўлган барча нарса

70+ AI билан таъминланган бепул асбоблар

Матнга сўзлаш

Аудио ва видео файлларни кўчириш

Тезкор транскрипция

Реал вақтдаги микрофон транскрипцияси

YouTube транскриптлари

Ҳар қандай видеодан субтитрларни ажратиш

Субтитрлар муҳаррири

SRT ва VTT файлларини онлайнда таҳрирлаш

Шоуларни олиб ташлаш

Аудиодан фон шовқинини олиб ташлаш

Аудио конвертер

MP3, WAV, FLAC, OGG, AAC ва бошқалар

Вокалларни олиб ташлаш

Вокалларни ажратиш ёки олиб ташлаш

Аудио қирғич

Аудио файлларни кесиш ва қисқартириш

Юклаб олиш

SRT, VTT, SSA, SBV форматлари

Йиғилиш протоколи

Фаолиятлар элементларини ажратиш ва қисқача тавсифи

Матндан сўзга

Матнни табиий сўзлашувга айлантириш

Субтитр таржимачиси

Субтитрларни 100 дан ортиқ тилларга таржима қилиш

Ҳамма 70+ асбобларни кўриш →

100+

Ёрдамчи тиллар

70+

Оқ асбоблар

1,300+

Қопланган платформалар

Экспорт форматлари

Ижодкорлар учун API

Сўздан матнга дастурингизга дақиқалар ичида интеграция қилинг. RESTful API реал вақтда WebSocket стримини қўллаб-қувватлайди.

REST + WebSocket — Файл юклаш ва реал вақтли узатиш

Кўплаб моделлар — Whisper, Canary, Enhanced ва бошқалар

Сўзловчи диаризацияси — Ким нимани айтганини автоматик аниқлаш

Яхши чиқинди — JSON, TXT, SRT, VTT сўзлар билан

API ҳужжатлари Ўйин майдони

import requests

response = requests.post(
    "https://api.stt.ai/v1/transcribe",
    headers={"Authorization": f"Bearer {API_KEY}"},
    files={"file": open("meeting.mp3", "rb")},
    data={
        "model": "large-v3-turbo",
        "language": "auto",
        "diarize": "true",
        "response_format": "json",
    },
)

result = response.json()
for seg in result["segments"]:
    print(f"{seg['speaker']}: {seg['text']}")

import fs from "fs";

const form = new FormData();
form.append("file", fs.createReadStream("meeting.mp3"));
form.append("model", "large-v3-turbo");
form.append("language", "auto");
form.append("diarize", "true");

const res = await fetch("https://api.stt.ai/v1/transcribe", {
  method: "POST",
  headers: { Authorization: `Bearer ${API_KEY}` },
  body: form,
});

const { segments } = await res.json();
segments.forEach(s =>
  console.log(`${s.speaker}: ${s.text}`)
);

Бошқа сўзлашувдан матн хизматларига ўтиш?

STT.ai vs Otter.ai STT.ai vs TurboScribe STT.ai vs Fireflies STT.ai vs Rev Ҳаммасини солиштириш →

Оддий, шаффоф нархлар

Бепул бошланг. Ўсиб боришингиз билан ўлчамингизни оширинг.

Оқ

$0/МБ

600 мин/ой

Тиллар
TXT & SRT экспорти
APIга кириш

Бошловчи

$9/МБ

3,000 мин/ой

100+ тиллар
Барча AI моделлари
Ҳамма экспорт форматлари

Энг машҳур

Про

$19/МБ

7,500 мин/ой

Шахсий транскриптлар
Тадбиркорлар сони чекланмаган
Авваллик ишлаш

Иш

$39/МБ

20,000 мин/ой

Pro'даги ҳаммаси
50K мин сақлаш
Маҳдум AI суҳбати

Ҳамма режалар ва нархларни кўриш →

Ёрдамчи тиллар

Барча 100+ тиллар →

English Spanish French German Japanese Chinese Arabic Hindi Portuguese Russian Korean Italian Turkish Dutch Polish +85 кўпроқ

Транскрипцияга тайёрмисиз?

Биринчи файлингизни бепул юклаб олинг. Кредит картаси йўқ, рўйхатдан ўтиш ҳам йўқ. Бепул планда ойига 600 дақиқа.

Транскрипцияни бошлаш

Кўп бериладиган саволлар

speech to text runs in your browser: paste a URL, upload a file, or record from your mic. STT.ai picks the AI model and returns the transcript in under 5 minutes. Export as TXT, SRT, VTT, DOCX, JSON, or PDF.

Yes — every visitor gets 600 free minutes/month on STT.ai, usable for speech to text the same as any other workflow. Paid plans starting at $5/month unlock longer files, private transcripts, and priority queueing.

speech to text runs on the same AI models as the rest of STT.ai — our best models reach 95-97% accuracy on clean speech (3-5% Word Error Rate on benchmarks). Switch models on the fly if the first pass is below your target.

speech to text can run on any of STT.ai's 10+ models — STT.ai Enhanced (most accurate), Whisper Large V3 (99 languages), NVIDIA Canary (#1 WER on supported langs), Whisper Turbo (fast), Moonshine (lightweight), and more.

Yes. Every transcript exports as SRT or VTT — works with YouTube, Vimeo, TikTok, VLC, and every major video player. The burn-subtitles tool overlays them onto video as hardsubs.

Yes. Speaker diarization automatically labels each voice (Speaker 1, Speaker 2, ...) and you can rename them in the built-in editor. Works across all models and languages.

Most speech to text jobs finish in under 5 minutes. A 1-hour audio file typically completes in 2-3 minutes with our fastest models. Speed depends on chosen model and current GPU load.

speech to text accepts 20+ formats — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and more. Output to TXT, SRT, VTT, DOCX, JSON, or PDF.

Yes. Audio files submitted to speech to text are processed and deleted by default. Pro plans add client-side encryption — even if STT.ai's database is breached, your transcripts are unreadable without your key. Data is never used for model training without explicit opt-in.

Yes. STT.ai offers a REST API with Python and Node.js SDKs, plus an MCP server for Claude and Cursor — all usable for speech to text workflows. Free API tier includes 100 minutes/month.

Yes. Every transcript opens in the built-in editor where you can correct words, rename speakers, adjust timestamps, and add notes. All changes save automatically.

Every transcript gets a unique shareable URL. Export to DOCX or PDF for email. Pro plans add password-protected and permanent links — useful for client work.

STT.ai handles 1,300+ platforms including YouTube, Vimeo, TikTok, SoundCloud, Zoom, Google Meet, podcast hosts, and more. URL transcription works with publicly-available content only — DRM-protected sources can't be transcribed.

Очиқ AI Матнга сўзлаш

Матнга сўзлашиш моделлари

STT.ai қандай ишлайди

1. Юклаш, ёзиш ёки URL'ни жойлаштириш

2. AI сиз танлаган модел билан ёзади

3. Экспорт қилиш, Улушлаш ёки Бирлаштириш

Кўп қўлланиладиган ҳолатлар

Аудио ва видео учун керак бўлган барча нарса

Ижодкорлар учун API

Оддий, шаффоф нархлар

Ёрдамчи тиллар

Транскрипцияга тайёрмисиз?

Кўп бериладиган саволлар

How does speech to text work on STT.ai?

Is speech to text free?

How accurate is speech to text?

What AI models can I use for speech to text?

Can I get subtitles from speech to text?

Does speech to text detect different speakers?

How long does speech to text take?

What input formats does speech to text support?

Is my audio private when I use speech to text?

Is there a speech to text API?

Can I edit a speech to text transcript after?

How do I share what speech to text produces?

What other platforms work beyond speech to text?