Transcribe with STT.ai Enhanced
3.2%
WER
100
Languages
160.0x
Speed
Proprietary
License
About STT.ai Enhanced
✦ Unlock Enhanced Model
Get access to our most accurate model with any paid plan. 3.2% WER, 160x real-time speed, 100+ languages.
View Plans →Model Info
- ProviderSTT.ai
- Architecture-
- LicenseProprietary
- UpdatedMar 2026
Tez-tez Sorulan Sual
STT.ai Enhanced STT.ai tərəfindən səs-mətn modeldir. STT.ai STT.ai Enhanced-i GPU infrastrukturumuzda yerləşdirir, buna görə də siz onu öz hardverinizi təmin etmədən istifadə edə bilərsiniz - audio və ya video yükləyin və STT.ai Enhanced-i model seçicisindən seçin.
Standart benchmarklarda STT.ai Enhanced 3.2% söz səhv dərəcəsinə nail olur. Real dünya doğruluğu səs keyfiyyətinə, aksenta və dilinə bağlıdır; səsli və aksentli qeydlər üçün bir neçə faiz daha yüksək WER gözləyin.
STT.ai Enhanced premium modeldir - ayda $5-dan başlayan hər hansı ödənişli STT.ai planı ilə daxildir. Pulsuz istifadəçilər qısa kliplərdə STT.ai Enhanced-i əvvəlcədən görə bilərlər; daha uzun fayllar aktiv plan tələb edir.
STT.ai Enhanced Proprietary altında paylanır. STT.ai-in hosted versiyası sizin üçün lisenziyanı idarə edir, buna görə də xidmətimiz vasitəsilə kommersiya istifadəsi asandır.
STT.ai Enhanced 100 dillərini dəstəkləyir. Avtomatik aşkarlama səsin çoxu üçün doğru dili seçir; siz onu əllə də müəyyən edə bilərsiniz.
STT.ai Enhanced audionu GPU-larda 160.0x real vaxtla işləyir. 1 saatlıq audio fayl 1 dəqiqə ərzində bitər; daha uzun fayllar növbəyə qoyularaq bitdikdə e-poçtla xəbərdar edilir.
STT.ai Enhanced-in 1.5B parametrləri var. Böyük modellər daha dəqiq, lakin daha yavaşdır; STT.ai GPU-da STT.ai Enhanced-i qəbul edir, buna görə də parametrlərin sayı sizin klient tərəfi performansınızı təsir etmir.
STT.ai Enhanced STT.ai-in dəstəklədiyi hər formatı qəbul edir — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI və digərləri. Çıxış TXT, SRT, VTT, DOCX, JSON və ya PDF olaraq.
Bəli. Hər bir transkripsiya üçün STT.ai Enhanced ilə birlikdə səsləndiricinin diarizasiyası işləyir - hər bir səsləndirici etiketlənir və sonradan redaktorda onları yenidən adlandıra bilərsiniz.
Bəli. STT.ai Enhanced bizim şəxsi infrastrukturumuzda işləyir - səs ön qurğulu olaraq işlənir və silinir. Pro+ klient tərəfli şifrələməyi əlavə edir, buna görə də transkriptlər sizin açarınız olmadan oxunmazdır, və Özəl Bulud sizə STT.ai Enhanced-i tamamilə öz VPC-nizdə öz-özünə host etməyə imkan verir.
STT.ai Enhanced-i eyni səsdə digər dəstəklənən modellərlə müqayisə etmək üçün compare-stt alətini istifadə et - siz WER, segment sayını, səsləndirici etiketlərini və etibarlılıq ballarını yan-yana görəcəksiniz. STT.ai Enhanced vs Whisper Large V3 müqayisəsi ən çox işlənəndir.
Bəli. /v1/transcribe son nöqtəsində model parametri olaraq "stt-ai-enhanced" göstərin. Python və Node.js SDK-ları STT.ai Enhanced nümunələrini ehtiva edir. Pulsuz API səviyyəsi ayda 100 dəqiqəni ehtiva edir.
STT.ai Enhanced üçün lisenziyalar STT.ai tərəfindən müəyyən edilir; öz-özünə hostinq onların şərtlərinə bağlıdır. STT.ai-in hostinq xidməti STT.ai Enhanced-i idarə olunan GPU-da işləyir, buna görə də bu inteqrasiya ilə məşğul olmağa ehtiyacınız yoxdur.