Transcribe with Distil-Whisper

Fungerer med offentligt tilgængelig lyd og video. DRM- beskyttet indhold understøttes ikke.

Opgradering til forbedret
Private transcript
Chat med udskrift
Lås op med Pro →
Slip fil her eller klik for at gennemse
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM ~ op til 2GB
Opgradering til forbedret
Private transcript
Chat med udskrift
Lås op med Pro →
Opgradering til forbedret
Registrering: 0:00
Realtid Vosk (øjeblikkelig)
Forbedret Hvisken (præcis)
Offentlige links: 24h, kun tekst · Tilmeld dig for 7d + lyd · Pro til private forbindelser

Real-time tale til tekst. AI auto-korrigerer som du taler nøjagtighed forbedrer med længere tale.

Test din mikrofon først
❤️ Love STT.ai? Fortæl dine venner!
Du har brugt dine gratis transskriptioner

Gratis tilmelding for at få 600 minutter/måned eller opgradering til ubegrænset transskription.

10 gratis min/dag 600 min fri med tilmelding Intet kreditkort Krypteret
Tilmeld dig gratis →
5.8%
WER
99
Languages
48.0x
Speed
MIT
License

About Distil-Whisper

Ofte stillede spørgsmål

Distil-Whisper er en tale-til-tekst model af Hugging Face. STT.ai værter Distil-Whisper på vores GPU-infrastruktur, så du kan bruge det uden at give din egen hardware uploade lyd eller video og vælge Distil-Whisper fra modelvælgeren.

På standard benchmarks, Distil-Whisper opnår omkring 5.8% Word Error Rate. Real-verden nøjagtighed afhænger af lydkvalitet, accent og sprog; for støjende eller accent optagelser, forventer et par procentpoint højere WER.

Distil-Whisper kører på STT.ai free tier ~ hver besøgende får 600 minutter / måned uden omkostninger. Betalte planer tilføje længere per-fil grænser, private udskrifter, og prioritet kø.

Distil-Whisper er udgivet under MIT, en permissiv open source licens. Du kan selvvært Distil-Whisper på din egen hardware eller bruge vores hosted version! begge er kommercielt brugbare.

Distil-Whisper understøtter 99 sprog. Auto-detektering vælger det rigtige sprog til de fleste lyd; du kan også angive det manuelt for en lille nøjagtighed elevator.

Distil-Whisper behandler lyd på omkring 48.0x realtid på vores GPU'er. En 1-timers lydfil slutter på under 1 minutter; længere filer kø og underrette via e-mail, når det er gjort.

Distil-Whisper har 756M parametre. Større modeller har tendens til at være mere præcise, men langsommere; STT.ai værter Distil-Whisper på GPU, så parameteren tæller ikke påvirker din klient-side ydeevne.

Distil-Whisper accepterer hvert format STT.ai understøtter ~ MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, og andre. Output som TXT, SRT, VTT, DOCX, JSON, eller PDF.

Ja. Speaker diarization kører sammen med Distil-Whisper for hver transskription! hver højttaler er mærket, og du kan omdøbe dem i editoren bagefter.

Ja. Distil-Whisper kører i vores administrerede miljø ~ lyd behandles og slettes som standard og aldrig bruges til træning uden eksplicit opt-in. Pro planer tilføje klient-side kryptering for udskrifter på hvile.

Brug sammenligning-stt værktøj til at køre Distil-Whisper mod enhver anden understøttet model på den samme lyd! du vil se WER, segment tæller, højttaler etiketter, og tillid scorer side om side. Distil-Whisper vs Whisper Stor V3 sammenligning er den mest almindelige køre.

Ja. Angiv "distil-whisper" som modelparameter på /v1/transcribe endpoint. Python og node.js SDKs omfatter Distil-Whisper eksempler. Gratis API-niveau inkluderer 100 minutter/måned.

Ja. Fordi Distil-Whisper er MIT-licenseret, kan du selv være vært for det. STT.ai open source side viser projektet repo og vægte. De fleste produktionshold bruger vores hosted version til at springe GPU indkøb, model swaps og ops.