Transcribe with Distil-Whisper

Virkar með almenningi tiltækum hljóð og myndskeið. DRM-varið efni er ekki stutt.

Uppfærsla fyrir Enhanced
Private transcript
Spjallaðu með afritun
Opna með Pro →
Slepptu skrá hér eða smelltu til að fletta
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM - allt að 2GB
Uppfærsla fyrir Enhanced
Private transcript
Spjallaðu með afritun
Opna með Pro →
Uppfærsla fyrir Enhanced
Upptaka: 0:00
Rauntími Vax (stund)
Endurbætt Whisper (nákvæm)
Almennir tenglar: 24 klst, aðeins texti · Skráðu þig inn fyrir 7d + hljóð · Pro Leita að einkatenglum

AI leiðréttir sjálfkrafa þegar þú talar - nákvæmni bætir við lengri ræðu.

Prófaðu hljóðnemann fyrst
❤️ Elska STT.ai? Segðu vinum þínum!
Ūú hefur notað ókeypis afritunina þína

Skráðu þig ókeypis til að fá 600 mínútur / mánuð, eða uppfæra fyrir ótakmarkaða afritun.

10 ókeypis mín / dag 600 mín ókeypis með skráningu Engin kreditkort Dulritað
Skráðu þig ókeypis →
5.8%
WER
99
Languages
48.0x
Speed
MIT
License

About Distil-Whisper

Algengar spurningar

STT.ai hýsir Distil-Whisper á GPU innviði okkar svo þú getur notað það án þess að útvega eigin vélbúnað - hlaða hljóð eða myndskeið og velja Distil-Whisper frá líkan picker.

Á venjulegum viðmiðum nær Distil-Whisper um 5.8% orðvillahlutfall. Nákvæmni í raunveruleikanum fer eftir hljóðgæðum, hreim og tungumáli. Fyrir háværar eða hreimlegar upptökur skal búast við nokkrum prósentustigum hærri WER.

Distil-Whisper keyrir á ókeypis stigi STT.ai - hver gestur fær 600 mínútur / mánuð án kostnaðar.Greitt áætlanir bæta við lengri takmörkum á skrá, einka afritunar og forgangsröðun.

Distil-Whisper er gefið út undir MIT, leyfilegt opið afnotaleyfi.Þú getur sjálf-hýsa Distil-Whisper á eigin vélbúnaði eða nota hýsta útgáfu okkar - bæði eru nothæf í atvinnuskyni.

Distil-Whisper styður 99 tungumál. Sjálfvirk greining velur rétt tungumál fyrir flest hljóð. Þú getur einnig tilgreint það handvirkt til að ná nákvæmni.

Distil-Whisper vinnur hljóð á um 48.0x rauntíma á GPU okkar.1 klukkustund hljóðskrá lýkur í undir 1 mínútur; lengri skrár biðröð og tilkynna með tölvupósti þegar gert.

Stærri gerðir hafa tilhneigingu til að vera nákvæmari en hægari; STT.ai hýsir Distil-Whisper á GPU þannig að fjöldi breytna hefur ekki áhrif á frammistöðu biðlara.

Distil-Whisper samþykkir hvert snið STT.ai styður - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI og aðrir.Output sem TXT, SRT, VTT, DOCX, JSON, eða PDF.

Hátalari diarization keyrir ásamt Distil-Whisper fyrir hverja uppskrift - hver hátalari er merkt og þú getur endurnefnt þá í ritlinum eftir það.

Já. Distil-Whisper keyrir í stjórnað umhverfi okkar - hljóð er unnið og eytt sjálfgefið og aldrei notað til þjálfunar án þess að skýrt sé valið. Pro áætlanir bæta við dulkóðun á viðskiptavinarhlið fyrir afritunarefni í hvíld.

Notaðu samanburðar-stt tólið til að keyra Distil-Whisper gegn öðrum studdum líkani á sama hljóðinu - þú munt sjá WER, hlutatölu, hátalaramerki og traust stig hlið við hlið.Distil-Whisper vs Whisper Large V3 samanburður er algengasta hlaupið.

Já. Tilgreindu "distil-whisper" sem líkan viðfang á /v1/transcribe endapunkti. Python og Node.js SDK innihalda Distil-Whisper dæmi. Ókeypis API tier inniheldur 100 mínútur / mánuð.

Já. Vegna þess að Distil-Whisper er MIT-leyfi, getur þú sjálfur hýst það. STT.ai's opinn uppspretta síðu sýnir verkefnið repo og þyngd. Flestir framleiðsluteymi nota hýsta útgáfu okkar til að sleppa GPU innkaupum, líkanskiptum og aðgerðum.