Transcribe with Whisper Large V3
4.2%
WER
99
Languages
8.0x
Speed
MIT
License
About Whisper Large V3
Model Info
- ProviderOpenAI
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Maiz egiten diren galderak
Whisper Large V3 OpenAIren hizketa-testu modelo bat da. STT.aik Whisper Large V3 gure GPU azpiegituran ostatzen du, zure hardwarea hornitu gabe erabil dezakezu, audioa edo bideoa igo eta Whisper Large V3 aukeratu modelo-hautatzailean.
Erreferentzia estandarretan, Whisper Large V3k %4.2 inguruko hitzen errore-tasa lortzen du. Benetako zehaztasuna audio-kalitatearen, azentuaren eta hizkuntzaren araberakoa da; grabazio zaratatsu edo azentudunetarako, WER ehuneko puntu batzuk handiagoa espero daiteke.
Whisper Large V3 STT.airen doako mailan exekutatzen da — bisitari bakoitzak 600 minutu/hilabete jasotzen ditu kosturik gabe. Ordainpeko planek fitxategiko muga luzeagoak gehitzen dituzte, transkribapen pribatuak eta lehentasun ilara.
Whisper Large V3 MIT lizentziapean argitaratzen da, kode irekiko lizentzia permisiboa. Zure hardwarean Whisper Large V3 ostatatu dezakezu edo gure ostatatutako bertsioa erabili — biak erabil daitezke merkataritzan.
Whisper Large V3k 99 hizkuntza onartzen ditu. Auto-detekzioak hizkuntza egokia hautatzen du audio gehienentzat; eskuz ere zehaztu dezakezu zehaztasun txikiagoa lortzeko.
Whisper Large V3-k audioa 8.0x denbora errealean prozesatzen du gure GPUetan. Ordu bateko audio-fitxategi bat 7 minututan amaitzen da; fitxategi luzeagoak ilaran jarri eta e-postaz jakinarazi egiten dira amaitzen direnean.
Whisper Large V3-k 1.55B parametro ditu. Modelo handiagoak zehatzagoak izaten dira, baina motelagoak; STT.ai-k Whisper Large V3 GPUan gordetzen du, beraz parametroen kopuruak ez du eraginik izango bezeroaren errendimenduan.
Whisper Large V3ek STT.aik onartzen dituen formatu guztiak onartzen ditu: MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI eta beste batzuk. Irteera TXT, SRT, VTT, DOCX, JSON edo PDF gisa.
Bai. Hiztun-diarizazioa Whisper Large V3rekin batera exekutatzen da transkribapen bakoitzean — hiztun bakoitza etiketatuta dago eta gero editorean izena aldatu ahal izango duzu.
Bai. Whisper Large V3 gure kudeatutako ingurunean exekutatzen da — audioa lehenespenez prozesatu eta ezabatu egiten da, eta ez da inoiz entrenamendurako erabiltzen, aldez aurretik aukeratu gabe. Pro planek bezeroaren aldeko enkriptatzea gehitzen dute transkribapen geldituetan.
Erabili compare-stt tresna Whisper Large V3 audio beraren beste edozein onartutako modeloren aurka exekutatzeko — WER, segmentu-kopurua, bozgorailuen etiketak eta konfiantza-puntuak aldi berean ikusiko dituzu. Whisper Large V3 eta Whisper Large V3 konparaketa da gehien erabiltzen dena.
Bai. Zehaztu "whisper-large-v3" modeloaren parametro gisa /v1/transcribe amaierako puntuan. Python eta Node.js SDKek Whisper Large V3 adibidea dute. API doako maila 100 minutukoa da hilean.
Bai. Whisper Large V3 MIT lizentziaduna denez, zeure burua ostatatu dezakezu. STT.airen kode irekiko orrialdean proiektuaren errepositorioa eta pisuak zerrendatzen dira. Produkzio-talde gehienek gure ostatatutako bertsioa erabiltzen dute GPU-ren erosketak, modeloen trukaketak eta operazioak saltatzeko.