ile Yazıya Dök Whisper Turbo

Halka açık ses ve video ile çalışır. DRM-koruyucu içerik desteklenmez.

İyileştirme için yükselt
Private transcript
Çeviri ile sohbet
Pro ile kilidi aç →
Dosyayı buraya bırak veya taramak için tıkla
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — 2GB'a kadar
İyileştirme için yükselt
Private transcript
Çeviri ile sohbet
Pro ile kilidi aç →
İyileştirme için yükselt
Kayıt: 0:00
Gerçek zamanlı Balmumu (anlık)
İyileştirilmiş Fısılda (kesin)
Halka açık bağlantılar: 24 saat, sadece metin · Kayıt ol 7d + ses için · Pro özel bağlantılar için

Gerçek zamanlı konuşmadan metne. AI konuşurken otomatik olarak düzeltir — doğruluk konuşma uzunlaştıkça iyileşir.

Önce mikrofonu test et
❤️ STT.ai'yi seviyor musunuz?
Bedava çevirilerini kullandın.

Ayda 600 dakika almak için ücretsiz kayıt olun veya sınırsız kopyalar için yükseltin.

Günde 10 dakika ücretsiz 600 dakika ücretsiz Kredi kartı yok. Şifrelenmiş
Ücretsiz kayıt olun →
5.1%
WER
99
Languages
32.0x
Speed
MIT
License

Hakkında Whisper Turbo

Sıkça Sorulan Sorular

Whisper Turbo, OpenAI tarafından geliştirilen bir konuşma-metin modelidir. STT.ai, Whisper Turbo'e GPU altyapımızda ev sahipliği yapmaktadır, böylece kendi donanımınızı sağlamadan kullanabilirsiniz - ses veya video yükleyin ve model seçicisinden Whisper Turbo'i seçin.

Standart referanslarda, Whisper Turbo yaklaşık %5.1 kelime hata oranına ulaşmıştır.Gerçek dünya doğruluğu ses kalitesine, aksan ve dile bağlıdır; gürültülü veya aksanlı kayıtlar için, birkaç yüzde puan daha yüksek WER bekleyin.

Whisper Turbo STT.ai'in ücretsiz seviyesinde çalışır - her ziyaretçi ücretsiz olarak ayda 600 dakika alır.Ödemeli planlar dosya başına daha uzun sınırlar, özel transkripsiyonlar ve öncelikli kuyruklar ekler.

Whisper Turbo, MIT, bir açık kaynak lisansı altında yayınlanmıştır. Whisper Turbo'i kendi donanımınızda kendi kendinize konumlandırabilir veya bizim konumlandırılmış sürümümüzü kullanabilirsiniz - her ikisi de ticari olarak kullanılabilir.

Whisper Turbo 99 dillerini destekler. Otomatik tespit çoğu ses için doğru dili seçer; küçük bir doğruluk artırımı için el ile de belirtebilirsiniz.

Whisper Turbo, GPU'larımızda yaklaşık 32.0x gerçek zamanlı ses işleme hızına sahiptir. 1 saatlik bir ses dosyası 1 dakikanın altında tamamlanır; daha uzun dosyalar kuyruğa alınır ve bittiğinde e-posta ile bildirim yapılır.

Whisper Turbo'in 809M parametresi vardır. Daha büyük modellerin daha doğru ama daha yavaş olmasına eğilim vardır; STT.ai GPU'da Whisper Turbo'e ev sahipliği yapar bu yüzden parametre sayısı istemci taraf performansınızı etkilemez.

Whisper Turbo, STT.ai'in desteklediği her biçimi kabul eder - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI ve diğerleri. Çıkış TXT, SRT, VTT, DOCX, JSON veya PDF olarak.

Evet, her bir transkrip için Whisper Turbo'in yanında konuşanların diarizasyonu çalışıyor. Her bir konuşan etiketleniyor ve sonradan editöründe isimlerini değiştirebilirsiniz.

Evet. Whisper Turbo bizim yönetilen ortamımızda çalışıyor - ses işleme ve varsayılan olarak silinir ve açıkça opt-in olmadan eğitim için asla kullanılmaz. Pro planları, bekleyen transkripler için istemci tarafı şifreleme ekler.

Aynı ses üzerinde Whisper Turbo'i diğer desteklenen modellerle karşılaştırmak için compare-stt aracı kullanın - WER, segment sayısını, hoparlör etiketlerini ve güven puanlarını yan yana göreceksiniz. Whisper Turbo vs Whisper Large V3 karşılaştırması en sık yapılandır.

Evet. /v1/transcribe son noktasında model parametresi olarak "whisper-turbo"yi belirtin. Python ve Node.js SDK'ları Whisper Turbo örneklerini içerir. Ücretsiz API katmanı ayda 100 dakika içerir.

Evet. Whisper Turbo MIT lisanslı olduğu için kendine ev sahipliği yapabilirsin. STT.ai'in açık kaynak sayfası proje deposunu ve ağırlıklarını listeler. Çoğu üretim ekibi GPU satın alımı, model değişimi ve operasyonları atlamak için ev sahipliği yaptığımız sürümü kullanır.