ile Yazıya Dök STT.ai Enhanced
3.2%
WER
100
Languages
160.0x
Speed
Proprietary
License
Hakkında STT.ai Enhanced
STT.ai Enhanced is our most accurate and fastest speech-to-text model. Built on cutting-edge transformer architecture with proprietary optimizations, it delivers industry-leading word error rates across 100+ languages. Ideal for production transcription, real-time captioning, and enterprise applications.
✦ Unlock Enhanced Model
Get access to our most accurate model with any paid plan. 3.2% WER, 160x real-time speed, 100+ languages.
View Plans →Model Info
- ProviderSTT.ai
- Architecture-
- LicenseProprietary
- UpdatedMar 2026
Sıkça Sorulan Sorular
STT.ai Enhanced, STT.ai tarafından geliştirilen bir konuşma-metin modelidir. STT.ai, STT.ai Enhanced'e GPU altyapımızda ev sahipliği yapmaktadır, böylece kendi donanımınızı sağlamadan kullanabilirsiniz - ses veya video yükleyin ve model seçicisinden STT.ai Enhanced'i seçin.
Standart referanslarda, STT.ai Enhanced yaklaşık %3.2 kelime hata oranına ulaşmıştır.Gerçek dünya doğruluğu ses kalitesine, aksan ve dile bağlıdır; gürültülü veya aksanlı kayıtlar için, birkaç yüzde puan daha yüksek WER bekleyin.
STT.ai Enhanced, ayda 5 $'dan başlayan herhangi bir ücretli STT.ai planıyla birlikte gelen bir premium modeldir. Bedava kullanıcılar STT.ai Enhanced'i kısa kliplerde önizleyebilir; daha uzun dosyalar aktif bir plan gerektirir.
STT.ai Enhanced Proprietary altında dağıtılmaktadır. STT.ai'in hosted sürümü lisans uyumluluğunu sizin için yönetir, bu yüzden ticari kullanımımız bizim hizmetimiz aracılığıyla basittir.
STT.ai Enhanced 100 dillerini destekler. Otomatik tespit çoğu ses için doğru dili seçer; küçük bir doğruluk artırımı için el ile de belirtebilirsiniz.
STT.ai Enhanced, GPU'larımızda yaklaşık 160.0x gerçek zamanlı ses işleme hızına sahiptir. 1 saatlik bir ses dosyası 1 dakikanın altında tamamlanır; daha uzun dosyalar kuyruğa alınır ve bittiğinde e-posta ile bildirim yapılır.
STT.ai Enhanced'in 1.5B parametresi vardır. Daha büyük modellerin daha doğru ama daha yavaş olmasına eğilim vardır; STT.ai GPU'da STT.ai Enhanced'e ev sahipliği yapar bu yüzden parametre sayısı istemci taraf performansınızı etkilemez.
STT.ai Enhanced, STT.ai'in desteklediği her biçimi kabul eder - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI ve diğerleri. Çıkış TXT, SRT, VTT, DOCX, JSON veya PDF olarak.
Evet, her bir transkrip için STT.ai Enhanced'in yanında konuşanların diarizasyonu çalışıyor. Her bir konuşan etiketleniyor ve sonradan editöründe isimlerini değiştirebilirsiniz.
Evet. STT.ai Enhanced özel altyapımızda çalışıyor - ses varsayılan olarak işleme ve silme yapılıyor. Pro + istemci tarafı şifreleme ekliyor, bu yüzden transkriptler anahtarınız olmadan okunmaz ve Özel Bulut STT.ai Enhanced'i tamamen kendi VPC'nizde kendi kendinize barındırmanıza izin veriyor.
Aynı ses üzerinde STT.ai Enhanced'i diğer desteklenen modellerle karşılaştırmak için compare-stt aracı kullanın - WER, segment sayısını, hoparlör etiketlerini ve güven puanlarını yan yana göreceksiniz. STT.ai Enhanced vs Whisper Large V3 karşılaştırması en sık yapılandır.
Evet. /v1/transcribe son noktasında model parametresi olarak "stt-ai-enhanced"yi belirtin. Python ve Node.js SDK'ları STT.ai Enhanced örneklerini içerir. Ücretsiz API katmanı ayda 100 dakika içerir.
STT.ai Enhanced için lisanslama STT.ai tarafından belirlenir; kendine hizmet vermek onların şartlarına bağlıdır. STT.ai'in kendine hizmet verme hizmeti STT.ai Enhanced'i yönetilen GPU'da çalıştırdığı için bu entegrasyonu ele almanıza gerek yoktur.