Rapporteer bug / feature request

Transcriberen met Distil-Whisper

Name: Distil-Whisper
Author: Hugging Face

Werkt met publiek beschikbare audio & video. DRM-beschermde inhoud wordt niet ondersteund.

Upgrade voor verbeterd

Privé-afschrift

Chat met transcript

Ontgrendelen met Pro →

Bestand hier neerzetten of klik om te bladeren

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM tot 2GB

Batch meerdere bestanden uploaden met Pro

Upgrade voor verbeterd

Privé-afschrift

Chat met transcript

Ontgrendelen met Pro →

Upgrade voor verbeterd

Real-time spraak op tekst. AI auto-correcties als u spreekt.. de nauwkeurigheid verbetert met langere spraak.

Test eerst je microfoon

10 vrij min/dag 600 min vrij met aanmelding Geen creditcard Versleuteld

Gratis aanmelden →

5.8%

WER

Talen

48.0x

Snelheid

MIT

Licentie

Info Distil-Whisper

Distil-Whisper is een gedistilleerde versie van Whisper gemaakt door Hugging Face. Het vermindert de modelgrootte met 49% en bereikt 6x snellere gevolgtrekking met behoud van 1% WER van de originele Whisper Large V2 op out-of-distributie evaluatiesets.

Talen Ondersteund door Distil-Whisper

Engels

Spaans

Frans

Duits

Chinees

Japans

Koreaans

Portugees

Arabisch

Hindi

Russisch

Italiaans

Nederlands

Turks

Pools

Zweeds

Indonesisch

Thai

Vietnamees

Tsjechisch

Grieks

Roemeens

Hongaars

Hebreeuws

Deens

Fins

Noors

Oekraïens

Maleis

Bengaals

Modelinformatie

AanbiederHugging Face
Architectuur-
LicentieMIT
BijgewerktMar 2026

Gerelateerde modellen

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Veelgestelde vragen

Distil-Whisper is een speech-to-text model van Hugging Face. STT.ai hosts Distil-Whisper op onze GPU-infrastructuur, zodat u het kunt gebruiken zonder het voorzien van uw eigen hardware te uploaden audio of video en kies Distil-Whisper uit de model picker.

Op standaard benchmarks bereikt Distil-Whisper ongeveer 5.8% Word Error Rate. Real-world nauwkeurigheid is afhankelijk van audiokwaliteit, accent en taal; voor lawaaierige of geaccentueerde opnames, verwachten een paar procentpunten hoger WER.

Distil-Whisper draait op STT.ai gratis tier.. elke bezoeker krijgt 600 minuten om te beginnen zonder kosten. Betaalde plannen toevoegen van langere per-bestand grenzen, privé transcripten, en prioriteit wachtrij.

Distil-Whisper wordt vrijgegeven onder MIT, een permissieve open-source licentie. U kunt zelf-host Distil-Whisper op uw eigen hardware of gebruik maken van onze gehoste versie zijn beide commercieel bruikbaar.

Distil-Whisper ondersteunt 99 talen. Autodetectie kiest de juiste taal voor de meeste audio; u kunt het ook handmatig specificeren voor een kleine nauwkeurigheid lift.

Distil-Whisper verwerkt audio op ongeveer 48.0x real-time op onze GPU's. Een 1-uurs audiobestand eindigt in minder dan 1 minuten; langere files wachtrij en melding per e-mail wanneer gedaan.

Distil-Whisper heeft 756M parameters. Grotere modellen hebben de neiging om nauwkeuriger maar langzamer te zijn; STT.ai hosts Distil-Whisper op GPU zodat de parametertelling geen invloed heeft op de prestaties van uw client-side.

Distil-Whisper accepteert elk formaat dat STT.ai ondersteunt. MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, en anderen. Output als TXT, SRT, VTT, DOCX, JSON, of PDF.

Ja. Speaker diarization loopt naast Distil-Whisper voor elke transcriptie • elke speaker is gelabeld en je kunt ze hernoemen in de editor achteraf.

Ja. Distil-Whisper wordt uitgevoerd in onze beheerde omgeving audio wordt verwerkt en verwijderd standaard en nooit gebruikt voor training zonder expliciete opt-in. Pro plannen toevoegen client-side encryptie voor transcripten in rust.

Gebruik de compare-stt tool om Distil-Whisper uit te voeren tegen elk ander ondersteund model op dezelfde audio, zie je WER, segment count, speaker labels, en vertrouwen scoort side-by-side. De Distil-Whisper vs Whisper Large V3 vergelijking is de meest voorkomende run.

Ja. Geef "distil-whisper" op als de modelparameter op het /v1/transcribe eindpunt. Python en Node.js SDK's bevatten Distil-Whisper voorbeelden. Gratis API tier bevat 100 minuten/maand.

Ja. Omdat Distil-Whisper is MIT-licentie, kunt u zelf-hosten. STT.ai open-source pagina bevat de project repo en gewichten. De meeste productieteams gebruiken onze gehoste versie om GPU inkoop over te slaan, model swaps, en ops.

Transcriberen met Distil-Whisper

Info Distil-Whisper

Talen Ondersteund door Distil-Whisper

Modelinformatie

Gerelateerde modellen

Veelgestelde vragen

Wat is Distil-Whisper?

Hoe nauwkeurig is Distil-Whisper?

Is Distil-Whisper gratis te gebruiken?

Welke licentie gebruikt Distil-Whisper?

Hoeveel talen ondersteunen Distil-Whisper?

Hoe snel is Distil-Whisper?

Hoe groot is het Distil-Whisper model?

Welke audioformaten kunnen Distil-Whisper transcriberen?

Detecteert Distil-Whisper meerdere luidsprekers?

Zijn mijn gegevens privé wanneer ik Distil-Whisper gebruik?

Hoe vergelijkt Distil-Whisper met andere STT-modellen?

Kan ik Distil-Whisper gebruiken via de API?

Kan ik Distil-Whisper draaien op mijn eigen server?