Free Speech to Text Online
AI-powered transcription ilə səsi mətnə çevirin. Audio faylları yükləyin, mikrofonunuzdan qeyd edin, ya da URL-i yapışdırın. 100+ dil, 10+ model, 98%+ dəqiqlik.
1. Speech Recording yüklə
Audio və ya video faylı yüklə, URL-i yapışdır, ya da mikrofonunuzdan səsi qeyd et.
2. AI Speech to Text çevirir
10+ AI modellərindən seçin. Dinləyici aşkarlama və dil avtomatik aşkarlama daxildir.
3. Transkriptinizi ixrac edin
6 formatda yükləyin. Audio oynatma ilə transkript bağlantılarını paylaşın.
Speech to Text Models
Sizin ehtiyaclarınıza uyğun olan AI modelini seçin — ya da ən yaxşısını seçməyə icazə verin.
100-dən çox dildə Speech to Text
Sənədləri mətnə çevirməyə hazırsınız?
Pulsuz Başla →Tez-tez Sorulan Sual
Speech to text (speech recognition or ASR də deyilir) səsli səsi avtomatik olaraq yazılı sözlərə çevirir. STT.ai səsi dinləyən və vaxt işarələrinə və səsləndirici etiketlərinə malik olan editoluna bilən mətni çıxaran AI modeli vasitəsilə qeydinizi idarə edir - yazmaq lazım deyil.
Akustik model səs dalğasını fonemlərə xəritələyir, sonra dil modeli bu dalğaları ən çox ola biləcək söz və işarələrə birləşdirir. STT.ai bu işi GPU üzərində Whisper Large V3 və NVIDIA Canary kimi modellərlə edir, buna görə də bir saatlıq qeyd adətən 2-3 dəqiqə ərzində tamamlanır.
Bəli. Hər ziyarətçi ilk faylınız üçün qeydiyyat tələb olunmadan ayda 600 pulsuz dəqiqə alır. Ödənişli planlar ayda $5-dan başlayır və daha uzun fayllar, şəxsi transkriptlər və prioritet işləmə əlavə edir.
Təmiz səslə ən yaxşı modellərimiz 95-97% dəqiqliyə çatır (3-5% söz səhv dərəcəsi). Arxa plan səsi, ağır aksent, qarşılıqlı danışıq və ya aşağı bit sürəti ilə dəqiqlik aşağı düşür - yaxşı mikrofon və sakit otaq ən böyük fərqi yaradır.
Bəli. Mikrofona danış və STT.ai canlı transkripsiya aləti vasitəsilə canlı transkripsiya yayar. Əgər danışarkən söz-söz transkripsiya etmək lazım deyilsə, tamamlanmış qeydi paket transkripsiyası üçün yükləyə bilərsiniz.
STT.ai 100-dən çox dili tanıyır və səsin çoxu üçün danışılmış dili avtomatik olaraq aşkar edir. Siz həmçinin dili əllə düzəldə bilərsiniz, bu da kiçik bir dəqiqlik artırır və qarışıq dil qeydləri klipin ortasında keçidlə idarə olunur.
Bəli. Oxucular diarı hər səsi (Oxucu 1, Oxucu 2,...) etiketləyir və siz onları redaktorda yenidən adlandıra bilərsiniz. Bu hər dəstəklənən model və dildə işləyir.
STT.ai MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM və AVI daxil olmaqla 20+ formatı qəbul edir. Çıxış TXT, SRT, VTT, DOCX, JSON və ya PDF-ə.
Speech to text WHAT was said into words transcribes; voice recognition (speaker identification) determines WHO said it. STT.ai both does — transcription plus speaker diarization — but the terms describe different tasks.
Bəli. Audio ön qurğulu olaraq işlənir və silinir. Pro planları müştəri tərəfli şifrələməyə əlavə edir, buna görə də transkriptlər sizin açarınız olmadan oxuna bilməz, hətta STT.ai-ə qədər də. Və sizin məlumatlarınız açıqca razılaşmadığınız halda heç vaxt model təlimində istifadə edilmir.
Bəli. STT.ai Python və Node.js SDK-ları ilə REST API-yə və Claude və Cursor üçün MCP serverinə malikdir. Pulsuz API səviyyəsi ayda 100 dəqiqəni əhatə edir, bundan sonra isə saniyəyə görə hesablanır.
Bəli. Hər bir transkript daxili redaktorda açılır və burada səhv eşidilən sözləri düzəldə, səsləndiricilərin adını dəyişə, vaxt damğalarını düzəldə və qeydlər əlavə edə bilərsiniz. Düzəltmələr hər bir ixrac formatında da davam edir.