Pranešti apie klaidą / funkcijų užklausą

Atsekti Distil-Whisper

Name: Distil-Whisper
Author: Hugging Face

Veikia su viešai prieinama garso ir vaizdo medžiaga. DRM apsaugotas turinys nepalaikomas.

Atnaujinti tobulinimui

Privatus stenograma

Pokalbis su stenograma

Atrakinti su Pro →

Numeskite failą čia arba spustelėkite norėdami naršyti

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM – iki 2GB

Partijos įkelti kelis failus su Pro

Atnaujinti tobulinimui

Privatus stenograma

Pokalbis su stenograma

Atrakinti su Pro →

Atnaujinti tobulinimui

Kalbėjimas realiu laiku su tekstu. AIS auto-korekcija, kai jūs kalbate — tikslumas pagerina ilgiau kalba.

Pirmiausia patikrinkite mikrofoną

10 nemokamų min. per dieną 600 min be registracijos Nėra kredito kortelės Šifruojama

Užsiregistruoti nemokamai →

5.8%

WER

Kalbos

48.0x

Greitis

MIT

Licencija

Apie Distil-Whisper

Distil-Whisper yra distiliuotas versija Whisper sukurtas Hugging Face. Jis sumažina modelio dydį 49% ir pasiekia 6x greičiau išvadų, tuo pat metu išlaikant 1% WER originalios Whisper didelis V2 nepaskirstymo vertinimo rinkiniuose.

Kalbos remiamos Distil-Whisper

Anglų

Ispanų

Prancūzų

Vokiečių

Kinų

Japonų

Korėjiečių

Portugalų

Arabų

Hindi

Rusų

Italų

Olandų

Turkų

Lenkų

Švedų

Indoneziečių

Tajų

Vietnamiečių

Čekų

Graikų

Rumunų

Vengrų

Hebrajų

Danų

Suomių

Norvegų

Ukrainiečių

Malajiečių

Bengalų

Pavyzdinės informacijos

TeikėjasHugging Face
Architektūra-
LicencijaMIT
AtnaujintaMar 2026

Susiję modeliai

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Dažnai užduodami klausimai

Distil-Whisper yra kalbos-teksto modelis iki Hugging Face. STT.ai savo GPU infrastruktūroje sumontuoti Distil-Whisper, todėl jį galite naudoti neįrengdami savo techninės įrangos – įkelkite garso ar vaizdo ir pasirinkite Distil-Whisper iš modelio parinkiklis.

Dėl standartinių lyginamųjų standartų, Distil-Whisper pasiekia apie 8801% Word error Rate. Realaus pasaulio tikslumas priklauso nuo garso kokybės, akcentas, ir kalba; Triukšmingų ar akcentuotų įrašų, tikėtis keletą procentinių punktų didesnis WER.

Distil-Whisper veikia STT.ai laisvų pakopų – kiekvienas lankytojas gauna 600 minučių pradėti be jokios kainos. Mokami planai pridėti daugiau per failą ribų, privačių stenogramų, ir prioritetinių eilė.

Distil-Whisper yra išleistas pagal MIT, leistina atviro kodo licencija. Galite savarankiškai-host Distil-Whisper ant savo aparatūros arba naudoti mūsų palaikomą versiją - abu yra komerciškai naudoti.

Distil-Whisper palaiko 99 kalbas. Automatinis aptikimas pasirenka reikiamą kalbą daugumai garso; taip pat galite nurodyti ją rankiniu būdu nedideliam tikslumui pakelti.

Distil-Whisper apdoroja garsą maždaug 48.0x realiu laiku mūsų GPU. 1 valandos garso failas baigiasi po 1 minučių; ilgesnis failų eilė ir apie tai praneš el. paštu, kai tai bus padaryta.

Distil-Whisper turi 756M parametrus. Didesni modeliai yra tikslesni, bet lėčiau; STT.ai GPU mazgai Distil-Whisper, todėl parametrų skaičius neturi įtakos Jūsų klientų veiklos rezultatams.

Distil-Whisper priima kiekvieną formatą STT.ai palaiko: MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI ir kt. Išvesti kaip TXT, SRT, VTT, DOCX, JSON, arba PDF.

Taip. Garsiakalbio diarizacija veikia šalia Distil-Whisper kiekvienam transkripcija – kiekvienas garsiakalbis yra pažymėtas ir galite pervadinti juos redaktoriuje po to.

Taip. Distil-Whisper veikia mūsų valdomoje aplinkoje — garso yra apdorojamas ir ištrinamas pagal nutylėjimą ir niekada naudojamas mokymui be aiškaus opt-in. Pro planai pridėti kliento pusėje šifravimo stenogramos poilsio.

Naudokite palyginimo-stt įrankis paleisti Distil-Whisper prieš bet kurį kitą palaikomą modelį tame pačiame garso — pamatysite WER, segmentų skaičių, garsiakalbių etiketes ir pasitikėjimo balus šalia-by-by. Distil-Whisper palyginti Whisper didelis V3 yra dažniausiai paleisti.

Taip. Nurodykite "distil-whisper" kaip modelio parametrą /v1/tractor parametrą. Python ir Node.js SDK yra Distil-Whisper pavyzdžiai. Nemokama API pakopa apima 100 minučių/mėnesį.

Taip. Kadangi Distil-Whisper yra MIT-licencijuotas, galite patys-host jį. STT.ai atviro kodo puslapis išvardija projekto atpirkimo ir svorius. Dauguma gamybos komandos naudoja mūsų įdiegtą versiją praleisti GPU pirkimų, modelių apsikeitimo, ir ops.

Atsekti Distil-Whisper

Apie Distil-Whisper

Kalbos remiamos Distil-Whisper

Pavyzdinės informacijos

Susiję modeliai

Dažnai užduodami klausimai

Kas yra Distil-Whisper?

Kiek tikslūs yra Distil-Whisper?

Ar Distil-Whisper laisva naudoti?

Kokią licenciją naudoja Distil-Whisper?

Kiek kalbų palaiko Distil-Whisper?

Kaip greitai yra Distil-Whisper?

Kiek didelis yra Distil-Whisper modelis?

Kokie garso formatai gali perrašyti Distil-Whisper?

Ar Distil-Whisper aptikti kelis garsiakalbius?

Ar mano duomenys privatūs naudojant Distil-Whisper?

Kaip palyginti su kitais STT modeliais Distil-Whisper?

Ar galiu naudoti Distil-Whisper per API?

Ar galiu paleisti Distil-Whisper savo serveryje?