Transcribe with Whisper Large V3
4.2%
WER
99
Languages
8.0x
Speed
MIT
License
About Whisper Large V3
Model Info
- ProviderOpenAI
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Često postavljana pitanja
STT.ai je domaćin Whisper Large V3 na našoj GPU infrastrukturi tako da ga možete koristiti bez da osigurate svoj vlastiti hardver — uploadati audio ili video i izabrati Whisper Large V3 iz birača modela.
Na standardnim benchmarkima, Whisper Large V3 postiže oko 4.2% stope greške riječi. realna tačnost zavisi od kvaliteta zvuka, naglaska i jezika; za bučne ili naglašene snimke, očekujte nekoliko postotnih bodova više WER.
Whisper Large V3 radi na STT.ai-ovom besplatnom nivou - svaki posjetilac dobiva 600 minuta/mjesečno bez troškova. plaćeni planovi dodaju dulje ograničenje po datoteci, privatne transkripte i prioritetno redoslijed.
Whisper Large V3 je objavljen pod MIT, dozvoljenom licencom otvorenog koda.Možete sami hostati Whisper Large V3 na svom hardveru ili koristiti našu hosted verziju — obje su komercijalno upotrebljive.
Whisper Large V3 podržava 99 jezika. Automatsko otkrivanje bira ispravan jezik za većinu audio; također ga možete ručno odrediti za malo povećanje tačnosti.
Whisper Large V3 obrađuje audio na oko 8.0x real-time na našim GPU-ovima. 1-satna audio datoteka završava za manje od 7 minuta; dulje datoteke čekaju i obavještavaju e-mailom kada je završeno.
Whisper Large V3 ima 1.55B parametra. Veći modeli imaju tendenciju da budu precizniji ali sporiji; STT.ai hosta Whisper Large V3 na GPU tako da broj parametara ne utječe na performanse klijenta.
Whisper Large V3 prihvaća svaki format koji podržava STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI i drugi. izlaz kao TXT, SRT, VTT, DOCX, JSON, ili PDF.
Da. Diarizacija govornika radi zajedno sa Whisper Large V3 za svaku transkripciju - svaki govornik je označen i možete ih preimenovati u editoru kasnije.
Da. Whisper Large V3 radi u našoj upravljanoj okolini — audio se obrađuje i briše po zadanim postavkama i nikada se ne koristi za trening bez eksplicitnog uključivanja. Pro planovi dodaju šifriranje na strani klijenta za transkripte u mirovanju.
Koristite compare-stt alat da pokrenete Whisper Large V3 protiv bilo kojeg drugog podržanog modela na istom audio — vidjet ćete WER, broj segmenata, oznake zvučnika, i pouzdanost ocjena jedan pored drugog. Whisper Large V3 vs Whisper Large V3 usporedba je najčešća.
Da. Navedite "whisper-large-v3" kao modelni parametar na /v1/transcribe krajnjoj tački. Python i Node.js SDK-ovi uključuju Whisper Large V3 primjere. Besplatni API nivo uključuje 100 minuta/mjesečno.
Da. Budući da je Whisper Large V3 licenciran za MIT, možete ga sami postaviti. Stranica otvorenog koda za STT.ai navodi projektni repozitorij i težine. Većina produkcijskih timova koristi našu verziju za preskakanje nabavke GPU-a, zamjene modela i operacija.