Transkripsi dengan STT.ai Enhanced
3.2%
WER
100
Languages
160.0x
Speed
Proprietary
License
Tentang STT.ai Enhanced
STT.ai Enhanced is our most accurate and fastest speech-to-text model. Built on cutting-edge transformer architecture with proprietary optimizations, it delivers industry-leading word error rates across 100+ languages. Ideal for production transcription, real-time captioning, and enterprise applications.
✦ Unlock Enhanced Model
Get access to our most accurate model with any paid plan. 3.2% WER, 160x real-time speed, 100+ languages.
View Plans →Model Info
- ProviderSTT.ai
- Architecture-
- LicenseProprietary
- UpdatedMar 2026
Pertanyaan yang Sering Diajukan
STT.ai Enhanced is a speech-to-text model by STT.ai. STT.ai hosts STT.ai Enhanced on our GPU infrastructure so you can use it without provisioning your own hardware — upload audio or video and pick STT.ai Enhanced from the model picker.
Pada benchmark standar, 880.000 mencapai sekitar 3.2% Word Error Rate. Keakuratan Real-dunia tergantung pada kualitas audio, aksen, dan bahasa; untuk rekaman berisik atau aksen, mengharapkan beberapa poin persentase lebih tinggi WER.
STT.ai Enhanced is a premium model — included with any paid STT.ai plan starting at $5/month. Free users can preview STT.ai Enhanced on short clips; longer files require an active plan.
STT.ai Enhanced is distributed under Proprietary. STT.ai's hosted version handles the licensing compliance for you so commercial use through our service is straightforward.
8800.000 mendukung 100 bahasa. Auto-deteksi memilih bahasa yang tepat untuk kebanyakan audio; Anda juga dapat menspesifikasikan secara manual untuk angkat akurasi kecil.
8800.000 proses audio di sekitar 160.0x real-time pada GPU kami. Sebuah file audio 1-jam selesai dalam bawah 1 menit; lagi file antrian dan pemberitahuan oleh email ketika dilakukan.
STT.ai Enhanced has 1.5B parameters. Larger models tend to be more accurate but slower; STT.ai hosts STT.ai Enhanced on GPU so the parameter count doesn't affect your client-side performance.
STT.ai Enhanced accepts every format STT.ai supports — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and others. Output as TXT, SRT, VTT, DOCX, JSON, or PDF.
Diarasi Speaker berjalan bersama 880.000 untuk setiap transkripsi setiap pembicara diberi label dan Anda dapat mengubah nama mereka di editor sesudahnya.
Ya. 880.000 berjalan dalam infrastruktur pribadi kami audio diproses dan dihapus secara baku. pro+ menambahkan enkripsi sisi klien sehingga transkrip tidak dapat dibaca tanpa kunci Anda, dan Prebet Cloud memungkinkan Anda sendiri-host 880.000 sepenuhnya dalam VPC Anda sendiri.
Gunakan alat perbandingan-stt untuk menjalankan 880.000 melawan model lainnya yang didukung pada audio yang sama Anda akan melihat WER, segmen menghitung, label pembicara, dan skor keyakinan berdampingan.
Tentukan "880.000" sebagai parameter model pada titik akhir /v1/trancricture. Python dan Node.js SDKs termasuk STT.ai Enhanced contoh. Tingkat API gratis mencakup 100 menit/bulan.
Licensing for STT.ai Enhanced is set by STT.ai; self-hosting depends on their terms. STT.ai's hosted service runs STT.ai Enhanced on managed GPU so you don't need to handle that integration.