Transcribe with Whisper Large V3

Radi s javno dostupnim audio & video. DRM zaštićeni sadržaj nije podržan.

Nadogradnja za poboljšanje
Private transcript
Čavrljaj s transkriptom
Otključaj pomoću pro →
Ispustite datoteku ovdje ili kliknite za pregled
MP3, WAV, M4A, FLAC, MP4, MKV, pokret, WebM — do 2GB
Nadogradnja za poboljšanje
Private transcript
Čavrljaj s transkriptom
Otključaj pomoću pro →
Nadogradnja za poboljšanje
Snimanje: 0:00
Realno vrijeme Vosk (instant)
Povećano Šaputanje (precizno)
Javne veze: 24h, samo tekst · Upišite se za 7d + zvuk · Profesionalno za privatne veze

Realno vrijeme govor na tekst. AI automatski ispravlja dok govorite – preciznost se poboljšava s dužim govorom.

Isprobaj prvo mikrofon
❤️ Love STT.ai? Tell your friends!
Koristio si besplatne transkripcije.

Prijavite se besplatno dobiti 600 minuta/mjesečno, ili nadogradnja za neograničene transkripcije.

10 besplatnih min/dan 600 min besplatno s prijavom Nema kreditne kartice Šifrirano
Upišite se besplatno →
4.2%
WER
99
Languages
8.0x
Speed
MIT
License

About Whisper Large V3

Česta pitanja

Whisper Large V3 je model govor-na-tekst od OpenAI. STT.ai domaćina Whisper Large V3 na našoj infrastrukturi GPU tako da ga možete koristiti bez opskrbe vlastitim hardverom – upload audio ili video i odaberite Whisper Large V3 iz modela birač.

Na standardnim mjerilima, Whisper Large V3 postiže oko 4.2% Word Pogreška. Preciznost stvarnog svijeta ovisi o kvaliteti zvuka, naglasku i jeziku; za bučne ili naglasene snimke, očekujte nekoliko postotka više WER.

Whisper Large V3 radi na STT.ai besplatnom nivou – svaki posjetitelj dobiva 600 minuta mjesečno bez troškova. Plaćeni planovi dodati više po datoteci ograničenja, privatne transkripte i prioritet reda.

Whisper Large V3 je pušten pod MIT, popustljiva dozvola otvorenog izvora. Možete samostalno voditi Whisper Large V3 na vlastitom hardveru ili koristiti našu domaću verziju – oboje su komercijalno upotrebljivi.

Whisper Large V3 podržava 99 jezika. Auto-detekcija bira pravi jezik za većinu zvuka; možete ga također ručno navesti za mali preciznost lift.

Whisper Large V3 procesa zvuka na oko 8.0x real-time na našem GPU-u. Jedan sat audio datoteka završava u manje od 8802 minuta; duže datoteke redak i obavijestite e-mailom kada se uradi.

Whisper Large V3 ima 8802 parametra. Veći modeli su točniji, ali sporije; STT.ai domaćina Whisper Large V3 na GPU tako da broj parametara ne utječe na performanse vašeg klijenta.

Whisper Large V3 prihvaća svaki oblik STT.ai podrške — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI i ostali. Izlaz kao TXT, SRT, VTT, DOCX, JSON, ili PDF.

Da. Zvučnička dijarizacija teče uz Whisper Large V3 za svaku transkripciju — svaki govornik je označen i možete ih nakon toga preimenovati u uredniku.

Da. Whisper Large V3 trči u našem upravljanom okruženju – audio se obrađuje i briše uobičajeno i nikada se ne koristi za trening bez eksplicitne opt-in. Pro planovi dodati klijent-strana enkripcija za transkripte u miru.

Koristite alat usporedbe-stt za pokretanje Whisper Large V3 protiv bilo kojeg drugog podržanog modela na istom zvuku – vidjet ćete WER, broj segmenta, zvučnike, i samopouzdanje rezultate strane-ba-side. Whisper Large V3 protiv Whisper Veliki V3 usporedba je najčešće pokrenuti.

Da. Navedite "whisper-large-v3" kao parametar modela na /v1/transcribe ishodu. Python i Node.js SDKs uključuju Whisper Large V3 primjera. Besplatni API stupanj uključuje 100 minuta/mjesec.

Da. Budući da je Whisper Large V3 je 8802-licensirana, možete ga samostalno voditi. STT.ai stranica otvorenog izvora popisuje repo i utege projekta. Većina proizvodnih timova koristi našu domaćinu za preskočenje GPU nabave, modela swaps, i ops.