Transcribe with Distil-Whisper

Radi sa javno dostupnim audio i video sadržajima. DRM-zaštićeni sadržaji nisu podržani.

Nadogradnja za poboljšano
Private transcript
Chat sa transkriptom
Otključaj sa Pro →
Ispusti datoteku ovdje ili klikni za pregledavanje
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — do 2GB
Nadogradnja za poboljšano
Private transcript
Chat sa transkriptom
Otključaj sa Pro →
Nadogradnja za poboljšano
Snimanje: 0:00
U stvarnom vremenu Vosak (trenutno)
Poboljšano Šepni (precizno)
2017.  Službena stranica (en) 24h. · Prijavite se for 7d + audio · Pro za privatne veze

Govor u tekst u realnom vremenu. AI automatski ispravlja dok govorite - tačnost se poboljšava s dužim govorom.

Prvo provjeri mikrofon
❤️ Volite STT.ai?
Koristio si svoje besplatne transkripte.

Registrirajte se besplatno da biste dobili 600 minuta mjesečno, ili nadogradite za neograničene transkripcije.

10 slobodnih minuta/dan 600 min besplatno uz prijavu Nema kreditne kartice Kriptirano
Prijavite se besplatno →
5.8%
WER
99
Languages
48.0x
Speed
MIT
License

About Distil-Whisper

Često postavljana pitanja

STT.ai je domaćin Distil-Whisper na našoj GPU infrastrukturi tako da ga možete koristiti bez da osigurate svoj vlastiti hardver — uploadati audio ili video i izabrati Distil-Whisper iz birača modela.

Na standardnim benchmarkima, Distil-Whisper postiže oko 5.8% stope greške riječi. realna tačnost zavisi od kvaliteta zvuka, naglaska i jezika; za bučne ili naglašene snimke, očekujte nekoliko postotnih bodova više WER.

Distil-Whisper radi na STT.ai-ovom besplatnom nivou - svaki posjetilac dobiva 600 minuta/mjesečno bez troškova. plaćeni planovi dodaju dulje ograničenje po datoteci, privatne transkripte i prioritetno redoslijed.

Distil-Whisper je objavljen pod MIT, dozvoljenom licencom otvorenog koda.Možete sami hostati Distil-Whisper na svom hardveru ili koristiti našu hosted verziju — obje su komercijalno upotrebljive.

Distil-Whisper podržava 99 jezika. Automatsko otkrivanje bira ispravan jezik za većinu audio; također ga možete ručno odrediti za malo povećanje tačnosti.

Distil-Whisper obrađuje audio na oko 48.0x real-time na našim GPU-ovima. 1-satna audio datoteka završava za manje od 1 minuta; dulje datoteke čekaju i obavještavaju e-mailom kada je završeno.

Distil-Whisper ima 756M parametra. Veći modeli imaju tendenciju da budu precizniji ali sporiji; STT.ai hosta Distil-Whisper na GPU tako da broj parametara ne utječe na performanse klijenta.

Distil-Whisper prihvaća svaki format koji podržava STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI i drugi. izlaz kao TXT, SRT, VTT, DOCX, JSON, ili PDF.

Da. Diarizacija govornika radi zajedno sa Distil-Whisper za svaku transkripciju - svaki govornik je označen i možete ih preimenovati u editoru kasnije.

Da. Distil-Whisper radi u našoj upravljanoj okolini — audio se obrađuje i briše po zadanim postavkama i nikada se ne koristi za trening bez eksplicitnog uključivanja. Pro planovi dodaju šifriranje na strani klijenta za transkripte u mirovanju.

Koristite compare-stt alat da pokrenete Distil-Whisper protiv bilo kojeg drugog podržanog modela na istom audio — vidjet ćete WER, broj segmenata, oznake zvučnika, i pouzdanost ocjena jedan pored drugog. Distil-Whisper vs Whisper Large V3 usporedba je najčešća.

Da. Navedite "distil-whisper" kao modelni parametar na /v1/transcribe krajnjoj tački. Python i Node.js SDK-ovi uključuju Distil-Whisper primjere. Besplatni API nivo uključuje 100 minuta/mjesečno.

Da. Budući da je Distil-Whisper licenciran za MIT, možete ga sami postaviti. Stranica otvorenog koda za STT.ai navodi projektni repozitorij i težine. Većina produkcijskih timova koristi našu verziju za preskakanje nabavke GPU-a, zamjene modela i operacija.