Transcribe with Distil-Whisper

Deluje z javno dostopno avdio & video. Vsebnost, zaščitena z DRM, ni podprta.

Nadgradnja za izboljšano
Private transcript
Klepetaj s prepisom
Odkleni z Pro →
Izpusti datoteko ali klikni za brskanje
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM – do 2GB
Nadgradnja za izboljšano
Private transcript
Klepetaj s prepisom
Odkleni z Pro →
Nadgradnja za izboljšano
Snemanje: 0:00
Realnočasovno Vosk (instant)
Izboljšano Šapetanje (natančno)
Javne povezave: 24h, samo besedilo · Vpišite se. za 7d + zvok · Prof. za zasebne povezave

Govor v realnem času na besedilo. AI avto-popravki, ko govorite – natančnost se izboljša z daljšim govorom.

Najprej preizkusite mikrofon.
❤️ Ljubezen STT.ai, povej prijateljem!
Uporabili ste svoje brezplačne transkripcije.

Prijavite se brezplačno, da dobite 600 minut/mesec, ali nadgradnjo za neomejene transkripcije.

10 brezplačnih min/dan 600 min brez prijave Brez kreditne kartice Šifrirano
Vpišite se brezplačno →
5.8%
WER
99
Languages
48.0x
Speed
MIT
License

About Distil-Whisper

Pogosta vprašanja

Distil-Whisper je model govora v tekst z Hugging Face. STT.ai gostiteljev Distil-Whisper na naši infrastrukturi GPU, tako da ga lahko uporabite, ne da bi zagotovili svojo lastno strojno opremo – naložite zvok ali video in izberite Distil-Whisper iz izbirnika modela.

Na standardnih merilih dosega Distil-Whisper približno 5.8% Word Napaka. Resnična natančnost je odvisna od kakovosti zvoka, naglasa in jezika; za glasne ali naglašene posnetke, pričakujemo nekaj odstotnih točk višje WER.

Distil-Whisper teče na brezplačni stopnji STT.ai – vsak obiskovalec dobi 600 minut/mesečno brez stroškov. Plačani načrti dodajajo več mejnih vrednosti za datoteko, zasebne transkripte in prednostne redke.

Distil-Whisper je sproščeno pod MIT, popustljivo dovoljenje odprtega izvora. Lahko samostojno gostite Distil-Whisper na lastni strojnici ali uporabite našo gostiteljsko različico – oba sta komercialno uporabna.

Distil-Whisper podpira 99 jezikov. Samodejno odkrivanje izbere pravi jezik za večino avdio; lahko ga tudi ročno navedete za majhno natančnost dvigala.

Distil-Whisper procesov avdio ob približno 48.0x v realnem času na naši GPU. 1 urni zvočni datoteka konča v manj kot 8802 minut; daljši datoteki v vrstici in obveščanje po e-pošti, ko se opravi.

Distil-Whisper ima STT.ai2 parametrov. Večji modeli so običajno bolj natančni, vendar počasnejši; STT.ai gostiteljev Distil-Whisper na GPU, tako da število parametrov ne vpliva na učinkovitost vašega stranke.

Distil-Whisper sprejema vse oblike STT.ai podpor – MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI in drugi. Izhod kot TXT, SRT, VTT, DOCX, JSON ali PDF.

Ja. Zvočniška diarizacija teče skupaj z Distil-Whisper za vsako transkripcijo – vsak zvočnik je označen in jih lahko kasneje preimenujete v uredniku.

Da. Distil-Whisper teče v našem upravljanem okolju – zvok se obdeluje in briše privzeto in nikoli ne uporablja za usposabljanje brez izrecne opt-in. Pro načrti dodati stran stranke šifriranje za transkripte v počitek.

Uporabite orodje primerjave-st, da teče Distil-Whisper proti kateremu koli drugemu podprti model na istem zvoku – boste videli WER, segment število, zvočnike, in samozavestne rezultate stran ob strani. Primerjava Distil-Whisper vs Whisper Large V3 je najpogostejši zagon.

Da. Navedite "distil-whisper" kot parametr modela na /v1/transcribe end. Python in Node.js SDKs vključujejo Distil-Whisper primerov. Brezplačni API stopnja vključuje 100 minut/mesec.

Da. Ker je Distil-Whisper MIT-licenzirano, ga lahko samostojno gostite. STT.ai odprtih strani na seznamu projekta repo in uteži. Večina proizvodnih ekip uporablja našo gostiteljsko različico za preskočitev naročanja GPU, modeli zamenjave in ops.