Hata / Özellik İstek Raporu

Bu ile kopyala Distil-Whisper

Name: Distil-Whisper
Author: Hugging Face

Halka açık ses ve video ile çalışır. DRM-koruyucu içerik desteklenmez.

İyileştirme için yükselt

Özel transkript

Çeviri ile sohbet

Pro ile kilidi aç →

Dosyayı buraya bırak veya taramak için tıkla

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — 2GB'a kadar

Çoklu dosya yükleme Pro ile

İyileştirme için yükselt

Özel transkript

Çeviri ile sohbet

Pro ile kilidi aç →

İyileştirme için yükselt

Gerçek zamanlı konuşmadan metne. AI konuşurken otomatik olarak düzeltir — doğruluk konuşma uzunlaştıkça iyileşir.

Önce mikrofonu test et

Günde 10 dakika ücretsiz 600 dakika ücretsiz Kredi kartı yok. Şifrelenmiş

Ücretsiz kayıt olun →

5.8%

WER

Dilleri

48.0x

Hız

MIT

Lisans

Hakkında Distil-Whisper

Distil-Whisper, Hugging Face tarafından yaratılan Whisper'ın bir damak tadına sahip bir versiyonudur. Modelin boyutlarını %49 oranında azaltıyor ve dağıtım dışı değerlendirme setlerinde orijinal Whisper Large V2'nin %1 WER'i içinde tutarak 6x daha hızlı bir çıkarım sağlamaktadır.

Desteklenen Diller Distil-Whisper

İngilizce

İspanyolca

Fransızca

Almanca

Çince

Japonca

Korece

Portekizce

Arapça

Hintçe

Rusça

İtalyanca

Felemenkçe

Türkçe

Lehçe

İsveççe

Endonezce

Tayca

Vietnamca

Çekçe

Yunanca

Rumence

Macarca

İbranice

Danca

Fince

Norveççe

Ukraynaca

Malayca

Bengalce

Model Bilgisi

SağlayıcıHugging Face
Mimarlık-
LisansMIT
GüncellendiMar 2026

İlgili Modeller

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Sıkça Sorulan Sorular

Distil-Whisper, Hugging Face tarafından geliştirilen bir konuşma-metin modelidir. STT.ai, Distil-Whisper'e GPU altyapımızda ev sahipliği yapmaktadır, böylece kendi donanımınızı sağlamadan kullanabilirsiniz - ses veya video yükleyin ve model seçicisinden Distil-Whisper'i seçin.

Standart referanslarda, Distil-Whisper yaklaşık %5.8 kelime hata oranına ulaşmıştır.Gerçek dünya doğruluğu ses kalitesine, aksan ve dile bağlıdır; gürültülü veya aksanlı kayıtlar için, birkaç yüzde puan daha yüksek WER bekleyin.

Distil-Whisper STT.ai'in ücretsiz seviyesinde çalışır - her ziyaretçi ücretsiz olarak başlatmak için 600 dakika alır.Ödemeli planlar dosya başına daha uzun sınırlar, özel transkriptler ve öncelikli kuyruk ekler.

Distil-Whisper, MIT, bir açık kaynak lisansı altında yayınlanmıştır. Distil-Whisper'i kendi donanımınızda kendi kendinize konumlandırabilir veya bizim konumlandırılmış sürümümüzü kullanabilirsiniz - her ikisi de ticari olarak kullanılabilir.

Distil-Whisper 99 dillerini destekler. Otomatik tespit çoğu ses için doğru dili seçer; küçük bir doğruluk artırımı için el ile de belirtebilirsiniz.

Distil-Whisper, GPU'larımızda yaklaşık 48.0x gerçek zamanlı ses işleme hızına sahiptir. 1 saatlik bir ses dosyası 1 dakikanın altında tamamlanır; daha uzun dosyalar kuyruğa alınır ve bittiğinde e-posta ile bildirim yapılır.

Distil-Whisper'in 756M parametresi vardır. Daha büyük modellerin daha doğru ama daha yavaş olmasına eğilim vardır; STT.ai GPU'da Distil-Whisper'e ev sahipliği yapar bu yüzden parametre sayısı istemci taraf performansınızı etkilemez.

Distil-Whisper, STT.ai'in desteklediği her biçimi kabul eder - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI ve diğerleri. Çıkış TXT, SRT, VTT, DOCX, JSON veya PDF olarak.

Evet, her bir transkrip için Distil-Whisper'in yanında konuşanların diarizasyonu çalışıyor. Her bir konuşan etiketleniyor ve sonradan editöründe isimlerini değiştirebilirsiniz.

Evet. Distil-Whisper bizim yönetilen ortamımızda çalışıyor - ses işleme ve varsayılan olarak silinir ve açıkça opt-in olmadan eğitim için asla kullanılmaz. Pro planları, bekleyen transkripler için istemci tarafı şifreleme ekler.

Aynı ses üzerinde Distil-Whisper'i diğer desteklenen modellerle karşılaştırmak için compare-stt aracı kullanın - WER, segment sayısını, hoparlör etiketlerini ve güven puanlarını yan yana göreceksiniz. Distil-Whisper vs Whisper Large V3 karşılaştırması en sık yapılandır.

Evet. /v1/transcribe son noktasında model parametresi olarak "distil-whisper"yi belirtin. Python ve Node.js SDK'ları Distil-Whisper örneklerini içerir. Ücretsiz API katmanı ayda 100 dakika içerir.

Evet. Distil-Whisper MIT lisanslı olduğu için kendine ev sahipliği yapabilirsin. STT.ai'in açık kaynak sayfası proje deposunu ve ağırlıklarını listeler. Çoğu üretim ekibi GPU satın alımı, model değişimi ve operasyonları atlamak için ev sahipliği yaptığımız sürümü kullanır.

Bu ile kopyala Distil-Whisper

Hakkında Distil-Whisper

Desteklenen Diller Distil-Whisper

Model Bilgisi

İlgili Modeller

Sıkça Sorulan Sorular

Distil-Whisper nedir?

Distil-Whisper ne kadar doğru?

Distil-Whisper ücretsiz mi?

Distil-Whisper hangi lisansı kullanıyor?

Distil-Whisper kaç dil destekliyor?

Distil-Whisper ne kadar hızlı?

Distil-Whisper modeli ne kadar büyük?

Distil-Whisper hangi ses formatlarını kopyalayabilir?

Distil-Whisper çoklu hoparlörleri tespit ediyor mu?

Distil-Whisper kullanırken verilerim gizli mi?

Distil-Whisper diğer STT modelleriyle nasıl karşılaştırılır?

API üzerinden Distil-Whisper'i kullanabilir miyim?

Distil-Whisper'i kendi sunucumda çalıştırabilir miyim?