Ilmoita vika / Ominaisuuspyyntö

Määrää lääkkeellä Whisper Large V3

Name: Whisper Large V3
Author: OpenAI

Toimii julkisesti saatavilla olevan äänen ja videon kanssa. DRM-suojattua sisältöä ei tueta.

Parannuksia parannuksiin

Yksityinen transkriptio

Juttele transkriptin kanssa

Avaa Pron kanssa →

Jätä tiedosto tähän tai napsauta selataksesi

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM – enintään 2GB

Erä lataa useita tiedostoja Pron kanssa

Parannuksia parannuksiin

Yksityinen transkriptio

Juttele transkriptin kanssa

Avaa Pron kanssa →

Parannuksia parannuksiin

Reaaliaikainen puhe tekstiksi. Tekoäly korjaa automaattisesti puhuessasi – tarkkuus paranee pidemmällä puheella.

Testaa mikrofonisi ensin

10 ilmaista min/päivä 600 min ilmaiseksi ilmoittautumalla Ei luottokorttia Salattu

Rekisteröidy ilmaiseksi →

4.2%

WER

Kielet

8.0x

Nopeus

MIT

Lisenssi

Tietoja Whisper Large V3

Whisper Large V3 on OpenAI:n lippulaiva, avoimen lähdekoodin puheentunnistusmalli. 1,55 miljardilla parametrilla se tarjoaa poikkeuksellisen tarkkuuden 99 kielelle. Se käyttää muuntajan koodaus-dekooderiarkkitehtuuria, joka on koulutettu 680 000 tunnin monikieliselle äänidatalle.

Kieliä tuetaan Whisper Large V3

Englanti

Espanja

Ranska

Saksa

Kiina

Japani

Korea

Portugali

Arabia

Hindi

Venäjä

Italia

Hollanti

Turkki

Puola

Ruotsi

Indonesia

Thai

Vietnam

Tšekki

Kreikka

Romania

Unkari

Heprea

Tanska

Suomi

Norja

Ukraina

Malaiji

Bengali

Malli-info

PalveluntarjoajaOpenAI
Arkkitehtuuri-
LisenssiMIT
PäivitettyMar 2026

Aiheeseen liittyvät mallit

3.2% WER

5.1% WER

3.5% WER

7.8% WER

3.0% WER

Usein kysyttyjä kysymyksiä

Whisper Large V3 on OpenAI:n puheesta tekstiin -malli. STT.ai isännöi Whisper Large V3:ta GPU-infrastruktuurissamme, joten voit käyttää sitä ilman, että varaat omia laitteitasi – lataat äänen tai videon ja valitset Whisper Large V3 mallinnostolaitteesta.

Standardimittauksissa Whisper Large V3 saavuttaa noin 8801 prosentin Word Error Rate -arvon. Todellisen maailman tarkkuus riippuu äänenlaadusta, aksentista ja kielestä; äänekkäiden tai korostuneiden äänitteiden osalta WER:n odotetaan olevan muutaman prosenttiyksikön korkeampi.

Whisper Large V3 kulkee STT.ai:n vapaalla tasolla – jokainen vierailija saa 600 minuuttia aikaa aloittaa ilmaiseksi. Maksetut suunnitelmat lisäävät tiedostojen välisiä rajoja, yksityisiä selostuksia ja jonottamista.

Whisper Large V3 julkaistaan sallivan avoimen lähdekoodin lisenssin alla. Voit itse isännöidä Whisper Large V3:ta omalla laitteistollasi tai käyttää isäntäversiotamme – molemmat ovat kaupallisesti käyttökelpoisia.

Whisper Large V3 tukee 99 kieltä. Automaattinen havainnointi valitsee oikean kielen useimmille äänille; voit myös määrittää sen manuaalisesti pientä tarkkuusnosturia varten.

Whisper Large V3 prosessorin äänentoisto noin 8.0x reaaliaikaisesti GPU:issa. Tunnin äänitiedosto valmistuu alle 7 minuutissa, pidempi tiedostojono ja ilmoitus sähköpostitse, kun se on tehty.

Whisper Large V3:ssa on 1.55B parametria. Suuremmat mallit ovat yleensä tarkempia, mutta hitaampia; STT.ai isännöi Whisper Large V3:a GPU:ssa, joten parametrien määrä ei vaikuta asiakaspuolen suorituskykyyn.

Whisper Large V3 hyväksyy jokaisen formaatin STT.ai tukea: MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI ja muut. Tuotos on TXT, SRT, VTT, DOCX, JSON tai PDF.

Kyllä. Kaiuttimen diarisointi kulkee Whisper Large V3:n rinnalla jokaista transkriptiota kohden – jokainen puhuja on merkitty, ja voit nimetä sen myöhemmin uudelleen päätoimittajaksi.

Kyllä. Whisper Large V3 kulkee hallitussa ympäristössämme – ääntä käsitellään ja poistetaan oletuksena, eikä sitä koskaan käytetä harjoitteluun ilman nimenomaista opt-iniä. Pro suunnittelee lisäävänsä asiakaspuolen salauksen selostuksiin levossa.

Verrattuna ensimmäiseen työkaluun voit ajaa Whisper Large V3 muuta saman äänen avulla tuettua mallia vastaan – näet WER:n, segmentin, kaiuttimen tarroja ja itseluottamuspisteitä vierekkäin. Whisper Large V3 vs. Whisper Large V3 -vertailu on yleisin.

Kyllä. Määrittele "whisper-large-v3" mallimuuttujaksi /v1/transcribe-päätetapahtumassa. Python ja Node.js SDKs sisältävät Whisper Large V3 esimerkkiä. Vapaa API-taso sisältää 100 minuuttia kuukaudessa.

Kyllä. Koska Whisper Large V3 on MIT-lisensoitu, voit itse isännöidä sitä. STT.ai:n avoimen lähdekoodin sivulla on listattu projektin repo ja painot. Useimmat tuotantoryhmät käyttävät isäntäversiotamme jättääkseen GPU-hankinnat, mallivaihdot ja opsit väliin.

Määrää lääkkeellä Whisper Large V3

Tietoja Whisper Large V3

Kieliä tuetaan Whisper Large V3

Malli-info

Aiheeseen liittyvät mallit

Usein kysyttyjä kysymyksiä

Mikä on Whisper Large V3?

Kuinka tarkka on Whisper Large V3?

Onko Whisper Large V3 ilmaista käyttöä?

Mitä lisenssiä Whisper Large V3 käyttää?

Kuinka monta kieltä Whisper Large V3 kannattaa?

Kuinka nopea on Whisper Large V3?

Kuinka iso on Whisper Large V3-malli?

Mitä ääniformaatteja Whisper Large V3 voi kirjoittaa?

Havaitseeko Whisper Large V3 useita puhujia?

Ovatko tietoni yksityisiä, kun käytän Whisper Large V3:ta?

Miten Whisper Large V3 vertautuu muihin STT-malleihin?

Voinko käyttää Whisper Large V3 API:n kautta?

Voinko ajaa Whisper Large V3 omalla palvelimellani?