Rapporter feil/ funksjonsforespørsel

Transkriber med Distil-Whisper

Name: Distil-Whisper
Author: Hugging Face

Arbeider med offentlig tilgjengelig lyd og video. DRM- beskyttet innhold er ikke støttet.

Oppgradering for forbedret

Privat utskrift

Chat med utskrift

Lås opp med Pro →

Slipp fil her eller trykk for å bla gjennom

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — opptil 2GB

Last opp flere filer (flerbildeverktøy) med Pro

Oppgradering for forbedret

Privat utskrift

Chat med utskrift

Lås opp med Pro →

Oppgradering for forbedret

Sanntidstale til tekst. AI korrigerer automatisk mens du snakker – nøyaktighet forbedres med lengre tale.

Test mikrofonen din først

10 gratis min/dag 600 min fri med registrering Intet kredittkort Kryptert

Registrer deg gratis →

5.8%

WER

Språk

48.0x

Hastighet

MIT

Lisens

Om Distil-Whisper

Destill- Whisper er en destillert versjon av Whisper laget av Hugging Face. Den reduserer modellstørrelsen med 49% og gir 6x raskere konklusjoner, samtidig som den opprinnelige Whisper Large V2 holdes innenfor 1% WER på evalueringssett som ikke er fordelt.

Språk støttet av Distil-Whisper

Engelsk

Spansk

Fransk

Tysk

Kinesisk

Japansk

Koreansk

Portugisisk

Arabisk

Hindi

Russisk

Italiensk

Nederlandsk

Tyrkisk

Polsk

Svensk

Indonesisk

Thai

Vietnamesisk

Tsjekkisk

Gresk

Rumensk

Ungarsk

Hebraisk

Dansk

Finsk

Norsk

Ukrainsk

Malayisk

Bengali

Modellinfo

LeverandørHugging Face
Arkitektur-
LisensMIT
OppdatertMar 2026

Tilknyttede modeller

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Ofte stilte spørsmål

Distil-Whisper er en tale-til-tekst-modell av Hugging Face. STT.ai er verter Distil-Whisper på vår GPU-infrastruktur slik at du kan bruke den uten å skaffe til veie din egen maskinvare – last opp lyd eller video og velg Distil-Whisper fra modellvelgeren.

Med standard standardverdier oppnår 88 000 omtrent 5.8% ordfeilrate. Nøyaktighet i den virkelige verden avhenger av lydkvalitet, aksent og språk. For opptak med støy eller aksent, forvent noen prosentpoeng høyere WER.

Distil-Whisper kjører på STT.ais ledig nivå – hver besøkende får 600 minutter til å starte uten kostnad. Betalingsplaner legger til lengre filgrenser, private utskrifter og prioritetskøing.

Distil-Whisper er frigitt under MIT, en ettergivende åpen kildekode- lisens. Du kan selv være vert Distil-Whisper på din egen maskinvare eller bruke vår vertsversjon – begge kan brukes kommersielt.

Distil-Whisper støtter 99 språk. Auto- deteksjon velger det riktige språket for de fleste lydene. Du kan også oppgi det manuelt for en liten presisjonsheis.

Distil-Whisper behandler lyd ved omlag 48.0x i sanntid på våre GPU- er. En en- times lydfil er ferdig på under 1 minutter, lengre filkø og varsles med e- post når den er ferdig.

Distil-Whisper har 756M parametre. Større modeller har en tendens til å være mer presise men langsommere. STT.ai er verter Distil-Whisper på GPU så parametertallet påvirker ikke din ytelse på klientsiden.

Distil-Whisper godtar alle format STT.ai støtter – MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI og andre. Utdata som TXT, SRT, VTT, DOCX, JSON eller PDF.

Ja. Høytalerdiarisering går sammen med Distil-Whisper for hver utskrift – hver høyttaler er merket og du kan endre navn på dem i redigeringen etterpå.

Ja. Distil-Whisper kjører i vårt styrte miljø – lyd behandles og slettes som standard og brukes aldri til trening uten eksplisitt valg. Pro planer legger til kryptering på klientsiden for utskrifter i hvile.

Bruk sammenlikningsverktøyet til å kjøre Distil-Whisper mot alle andre modeller som støttes på samme lyd – du får se WER, segmenttelling, høyttal og tillitspoeng side om side. Sammenlikningen Distil-Whisper mot Whisper Stor V3 er det vanligste kjøreverktøyet.

Ja. Oppgi « distil-whisper » som modellparameter for sluttpunktet / v1/ trancribe. Python og Node. js SDK inkluderer Distil-Whisper eksempler. Free API- nivå inkluderer 100 minutter/ måned.

Ja, fordi Distil-Whisper er MIT-lisensert, kan du selv være vert for det. STT.ai-tallets åpen-kildekode side lister prosjektet repo og vekter. de fleste produksjonsteam bruker vår vertsversjon til å hoppe over GPU innkjøp, modellbytteavtaler og ops.

Transkriber med Distil-Whisper

Om Distil-Whisper

Språk støttet av Distil-Whisper

Modellinfo

Tilknyttede modeller

Ofte stilte spørsmål

Hva er Distil-Whisper?

Hvor nøyaktig er Distil-Whisper?

Er Distil-Whisper gratis å bruke?

Hvilket førerkort bruker Distil-Whisper?

Hvor mange språk støtter Distil-Whisper?

Hvor fort er Distil-Whisper?

Hvor stor er Distil-Whisper-modellen?

Hvilke lydformater kan Distil-Whisper transskribere?

Finner Distil-Whisper flere høyttalere?

Er mine data private når de bruker Distil-Whisper?

Hvordan sammenlignes 88 000 med andre STT-modeller?

Kan jeg bruke Distil-Whisper via API?

Kan jeg kjøre Distil-Whisper på min egen tjener?