Transcribe with STT.ai Enhanced
3.2%
WER
100
Languages
160.0x
Speed
Proprietary
License
About STT.ai Enhanced
✦ Unlock Enhanced Model
Get access to our most accurate model with any paid plan. 3.2% WER, 160x real-time speed, 100+ languages.
View Plans →Model Info
- ProviderSTT.ai
- Architecture-
- LicenseProprietary
- UpdatedMar 2026
Soalan Lazim
STT.ai Enhanced adalah model pertuturan-ke-teks oleh STT.ai. STT.ai memuatkan STT.ai Enhanced pada infrastruktur GPU kami supaya anda boleh menggunakannya tanpa menyediakan perkakasan anda sendiri — muat naik audio atau video dan pilih STT.ai Enhanced dari pemilih model.
Pada piawaian piawai, STT.ai Enhanced mencapai kira-kira 3.2% Kadar Ralat Perkataan. Ketepatan dunia nyata bergantung pada kualiti audio, loghat, dan bahasa; untuk rakaman bising atau loghat, harapkan beberapa peratusan WER yang lebih tinggi.
STT.ai Enhanced adalah model premium — dimasukkan dengan mana-mana rancangan STT.ai berbayar bermula pada $5/bulan. Pengguna percuma boleh pralihat STT.ai Enhanced pada klip pendek; fail yang lebih panjang memerlukan rancangan aktif.
STT.ai Enhanced disalurkan di bawah Proprietary. Versi dihost STT.ai mengendalikan keserasian lesen untuk anda jadi penggunaan komersial melalui perkhidmatan kami adalah mudah.
STT.ai Enhanced menyokong 100 bahasa. Auto-kesan memilih bahasa yang betul untuk kebanyakan audio; anda juga boleh nyatakannya secara manual untuk ketelusan yang lebih baik.
STT.ai Enhanced memproses audio pada kira-kira 160.0x masa nyata pada GPU kami. Fail audio 1 jam selesai dalam kurang daripada 1 minit; fail yang lebih panjang berijil dan maklumkan melalui emel bila selesai.
STT.ai Enhanced mempunyai parameter 1.5B. Model yang lebih besar cenderung lebih tepat tetapi lebih perlahan; STT.ai memuatkan STT.ai Enhanced pada GPU jadi kiraan parameter tidak mempengaruhi prestasi sisi klien anda.
STT.ai Enhanced menerima setiap format yang disokong STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, dan lain-lain. Output sebagai TXT, SRT, VTT, DOCX, JSON, atau PDF.
Ya. Diarisasi pembicara berjalan bersama STT.ai Enhanced untuk setiap transkripsi — setiap pembicara dilabel dan anda boleh menamakan semula mereka dalam editor selepas itu.
Ya. STT.ai Enhanced berjalan dalam infrastruktur persendirian kami — audio diproses dan dipadam secara lalai. Pro+ menambah penyulitan sisi klien supaya transkripsi tidak boleh dibaca tanpa kunci anda, dan Awan Persendirian membolehkan anda menghost STT.ai Enhanced sepenuhnya dalam VPC anda sendiri.
Gunakan alat compare-stt untuk jalankan STT.ai Enhanced terhadap model yang disokong lain pada audio yang sama — anda akan lihat WER, kiraan segmen, label pengeras, dan skor keyakinan berdampingan. Perbandingan STT.ai Enhanced vs Whisper Large V3 adalah yang paling biasa dijalankan.
Ya. Nyatakan "stt-ai-enhanced" sebagai parameter model pada titik akhir /v1/transcribe. Python dan Node.js SDKs termasuk contoh STT.ai Enhanced. Tahap API percuma termasuk 100 minit/bulan.
Lisensi untuk STT.ai Enhanced ditetapkan oleh STT.ai; penghijrahan-sendiri bergantung pada terma mereka. Servis dihost STT.ai menjalankan STT.ai Enhanced pada GPU yang dikendalikan jadi anda tidak perlu mengendalikan integrasi itu.