Adrodd Nam / Cais Nodweddion

Trosysgrifo gyda Distil-Whisper

Name: Distil-Whisper
Author: Hugging Face

Gweithio gyda sain a fideo sydd ar gael yn gyhoeddus. Ni chynhelir cynnwys sydd wedi'i amddiffyn gan DRM.

Uwchraddio i Gyflym

Trawssgrifiad Preifat

Sgwrsio gyda throsglwyddiad

Datgloi gyda Pro →

Rholio ffeil yma neu glicio i bori

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM - hyd at 2GB

Lanlwytho ffeiliau lluosol gyda Pro

Uwchraddio i Gyflym

Trawssgrifiad Preifat

Sgwrsio gyda throsglwyddiad

Datgloi gyda Pro →

Uwchraddio i Gyflym

Llythrennedd amser real i destun. Mae AI yn cywiro'n awtomatig wrth i chi siarad - mae cywirdeb yn gwella gyda llais hirach.

Arbrofi eich meicroffon yn gyntaf

10 munud rhydd/diwrnod 600 munud am ddim gyda chofrestru Dim cerdyn credyd Wedi' i amgryptio

Cofrestru am ddim →

5.8%

WER

Iaith:

48.0x

Cyflymder

MIT

Trwydded

Am Distil-Whisper

Fersiwn ddistyll o Whisper yw Distil-Whisper, a grëwyd gan Hugging Face. Mae'n lleihau maint y model gan 49% ac yn cyflawni dehongliad 6x yn gyflymach tra'n cadw o fewn 1% WER y Whisper Large V2 gwreiddiol ar set o arfarniad allan-o-ddarpariaeth.

Ieithoedd a gynhelir gan Distil-Whisper

Saesneg

Sbaeneg

Ffrangeg

Almaeneg

Tsieinëeg

Japaneeg

Coreeg

Portiwgaleg

Arabeg

Hindi

Rwseg

Eidaleg

Iseldireg

Tyrceg

Pwyleg

Swedeg

Indoneseg

Thai

Fietnameg

Tsieceg

Groeg

Rwmaneg

Hwngareg

Hebraeg

Daneg

Ffinneg

Norwyeg

Wcreineg

Maleieg

Bengaleg

Gwybodaeth Model

DarparwrHugging Face
Adeiladu-
TrwyddedMIT
DiweddarwydMar 2026

Modelau cysylltiedig

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Cwestiynau a Ofynnir yn Aml

Model siarad-i-testun gan Hugging Face yw Distil-Whisper. Mae STT.ai yn gwestiwn Distil-Whisper ar ein strwythur GPU felly gallwch ei ddefnyddio heb ddarparu eich caledwedd eich hun - lawrlwythwch sain neu fideo a dewiswch Distil-Whisper o'r dewisydd model.

Ar fesurau safonol, mae Distil-Whisper yn cyrraedd Cyfradd Gwallau Geiriau o tua 5.8%. Mae cywirdeb yn y byd go iawn yn dibynnu ar ansawdd sain, sain a iaith; ar gyfer recordiadau swnllyd neu sainedig, disgwyliwch ychydig o bwyntiau canran uwch WER.

Mae Distil-Whisper yn rhedeg ar lefel rhad ac am ddim STT.ai - mae gan bob ymwelydd 600 munud i ddechrau heb gost. Mae cynlluniau talu yn ychwanegu terfynau ffeil hirach, trosglwyddiadau preifat, a cheisio blaenoriaeth.

Cyhoeddir Distil-Whisper o dan MIT, trwydded ffynhonnell agored ganiataol. Gallwch hunan-gartrefu Distil-Whisper ar eich caledwedd eich hun neu ddefnyddio ein fersiwn cartrefiedig — mae'r ddau yn defnyddiol yn fasnachol.

Cynhelir Distil-Whisper iaith 99. Mae darganfod yn awtomatig yn dewis yr iaith gywir ar gyfer y rhan fwyaf o sain; gallwch hefyd ei benodi â llaw er mwyn gwella cywirdeb ychydig.

Mae Distil-Whisper yn prosesu sain ar tua 48.0x amser real ar ein GPUs. Mae ffeil sain 1 awr yn gorffen mewn llai na 1 munud; mae ffeiliau hirach yn rhedeg yn y rhes a chaiff eu hysbysu drwy e-bost pan fyddant wedi gorffen.

Mae gan Distil-Whisper baramedrau 756M. Mae modelau mwy yn tueddu i fod yn fwy cywir ond yn araf; mae STT.ai yn gwestiwn Distil-Whisper ar y GPU felly nid yw'r cyfrif paramedrau yn effeithio ar eich perfformiad ochr y cleient.

Mae Distil-Whisper yn derbyn pob fformat a gynhelir gan STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, ac eraill. Allbwn fel TXT, SRT, VTT, DOCX, JSON, neu PDF.

Ie. Rheda diareiddio siaradwyr gyda Distil-Whisper ar gyfer pob trosysgrifiad - mae pob siaradwr yn cael ei labelu a gallwch eu hail-enwi yn y golygydd yna.

Ydy. Mae Distil-Whisper yn rhedeg yn ein hamgylchedd rheoli — mae sain yn cael ei brosesu a'i ddileu yn rhagosodedig ac ni chaiff ei ddefnyddio erioed ar gyfer hyfforddiant heb optio i mewn yn glir. Mae cynlluniau Pro yn ychwanegu amgryptio ochr y cleient ar gyfer trosysgrifau wrth aros.

Defnyddiwch yr erfyn compare-stt i redeg Distil-Whisper yn erbyn unrhyw ddull arall a gynhelir ar yr un sain — byddwch yn gweld WER, cyfrif segmentau, labeli siaradwyr, a sgôr ymddiriedaeth ochr yn ochr. Y cymhariaeth Distil-Whisper vs Whisper Large V3 yw'r un fwyaf cyffredin.

Ie. Penodi "distil-whisper" fel paramedr model ar y /v1/transcribe diwedd-bwynt. Mae Python a Node.js SDKs yn cynnwys enghreifftiau Distil-Whisper. Mae lefel API am ddim yn cynnwys 100 munud/mis.

Ie. Gan fod Distil-Whisper yn cael ei drwyddedu gan MIT, gallwch ei hunan-gartrefu. Mae tudalen ffynhonnell agored STT.ai yn rhestru'r storfa a'r pwysau. Mae'r rhan fwyaf o'r timau cynhyrchu yn defnyddio ein fersiwn cartrefi i hepgor prynu GPU, cyfnewid modelau, ac ops.

Trosysgrifo gyda Distil-Whisper

Am Distil-Whisper

Ieithoedd a gynhelir gan Distil-Whisper

Gwybodaeth Model

Modelau cysylltiedig

Cwestiynau a Ofynnir yn Aml

Beth yw Distil-Whisper?

Pa mor gywir yw Distil-Whisper?

A yw Distil-Whisper yn rhad i'w ddefnyddio?

Pa drwydded mae Distil-Whisper yn ei defnyddio?

Faint o ieithoedd mae Distil-Whisper yn eu cynnal?

Pa mor gyflym yw Distil-Whisper?

Faint yw maint y model Distil-Whisper?

Pa fformatau sain y gall Distil-Whisper eu trosysgrifo?

A yw Distil-Whisper yn canfod nifer o siaradwyr?

A yw fy data yn breifat pan yn defnyddio Distil-Whisper?

Sut mae Distil-Whisper yn cymharu â modelau STT eraill?

A allaf ddefnyddio Distil-Whisper drwy'r API?

A allaf redeg Distil-Whisper ar fy gweinydd fy hun?