Rapporter feil/ funksjonsforespørsel

Transkriber med Whisper Large V3

Name: Whisper Large V3
Author: OpenAI

Arbeider med offentlig tilgjengelig lyd og video. DRM- beskyttet innhold er ikke støttet.

Oppgradering for forbedret

Privat utskrift

Chat med utskrift

Lås opp med Pro →

Slipp fil her eller trykk for å bla gjennom

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — opptil 2GB

Last opp flere filer (flerbildeverktøy) med Pro

Oppgradering for forbedret

Privat utskrift

Chat med utskrift

Lås opp med Pro →

Oppgradering for forbedret

Sanntidstale til tekst. AI korrigerer automatisk mens du snakker – nøyaktighet forbedres med lengre tale.

Test mikrofonen din først

10 gratis min/dag 600 min fri med registrering Intet kredittkort Kryptert

Registrer deg gratis →

4.2%

WER

Språk

8.0x

Hastighet

MIT

Lisens

Om Whisper Large V3

Whisper Large V3 er OpenAIs flaggskips- åpen- kildekode talegjenkjenningsmodell. Med 1, 55 milliarder parametre gir den ekstraordinær nøyaktighet over 99 språk. Den bruker en transformator- koder- arkitektur trent til 680. 000 timers flerspråklige lyddata.

Språk støttet av Whisper Large V3

Engelsk

Spansk

Fransk

Tysk

Kinesisk

Japansk

Koreansk

Portugisisk

Arabisk

Hindi

Russisk

Italiensk

Nederlandsk

Tyrkisk

Polsk

Svensk

Indonesisk

Thai

Vietnamesisk

Tsjekkisk

Gresk

Rumensk

Ungarsk

Hebraisk

Dansk

Finsk

Norsk

Ukrainsk

Malayisk

Bengali

Modellinfo

LeverandørOpenAI
Arkitektur-
LisensMIT
OppdatertMar 2026

Tilknyttede modeller

3.2% WER

5.1% WER

3.5% WER

7.8% WER

3.0% WER

Ofte stilte spørsmål

Whisper Large V3 er en tale-til-tekst-modell av OpenAI. STT.ai er verter Whisper Large V3 på vår GPU-infrastruktur slik at du kan bruke den uten å skaffe til veie din egen maskinvare – last opp lyd eller video og velg Whisper Large V3 fra modellvelgeren.

Med standard standardverdier oppnår 88 000 omtrent 4.2% ordfeilrate. Nøyaktighet i den virkelige verden avhenger av lydkvalitet, aksent og språk. For opptak med støy eller aksent, forvent noen prosentpoeng høyere WER.

Whisper Large V3 kjører på STT.ais ledig nivå – hver besøkende får 600 minutter til å starte uten kostnad. Betalingsplaner legger til lengre filgrenser, private utskrifter og prioritetskøing.

Whisper Large V3 er frigitt under MIT, en ettergivende åpen kildekode- lisens. Du kan selv være vert Whisper Large V3 på din egen maskinvare eller bruke vår vertsversjon – begge kan brukes kommersielt.

Whisper Large V3 støtter 99 språk. Auto- deteksjon velger det riktige språket for de fleste lydene. Du kan også oppgi det manuelt for en liten presisjonsheis.

Whisper Large V3 behandler lyd ved omlag 8.0x i sanntid på våre GPU- er. En en- times lydfil er ferdig på under 7 minutter, lengre filkø og varsles med e- post når den er ferdig.

Whisper Large V3 har 1.55B parametre. Større modeller har en tendens til å være mer presise men langsommere. STT.ai er verter Whisper Large V3 på GPU så parametertallet påvirker ikke din ytelse på klientsiden.

Whisper Large V3 godtar alle format STT.ai støtter – MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI og andre. Utdata som TXT, SRT, VTT, DOCX, JSON eller PDF.

Ja. Høytalerdiarisering går sammen med Whisper Large V3 for hver utskrift – hver høyttaler er merket og du kan endre navn på dem i redigeringen etterpå.

Ja. Whisper Large V3 kjører i vårt styrte miljø – lyd behandles og slettes som standard og brukes aldri til trening uten eksplisitt valg. Pro planer legger til kryptering på klientsiden for utskrifter i hvile.

Bruk sammenlikningsverktøyet til å kjøre Whisper Large V3 mot alle andre modeller som støttes på samme lyd – du får se WER, segmenttelling, høyttal og tillitspoeng side om side. Sammenlikningen Whisper Large V3 mot Whisper Stor V3 er det vanligste kjøreverktøyet.

Ja. Oppgi « whisper-large-v3 » som modellparameter for sluttpunktet / v1/ trancribe. Python og Node. js SDK inkluderer Whisper Large V3 eksempler. Free API- nivå inkluderer 100 minutter/ måned.

Ja, fordi Whisper Large V3 er MIT-lisensert, kan du selv være vert for det. STT.ai-tallets åpen-kildekode side lister prosjektet repo og vekter. de fleste produksjonsteam bruker vår vertsversjon til å hoppe over GPU innkjøp, modellbytteavtaler og ops.

Transkriber med Whisper Large V3

Om Whisper Large V3

Språk støttet av Whisper Large V3

Modellinfo

Tilknyttede modeller

Ofte stilte spørsmål

Hva er Whisper Large V3?

Hvor nøyaktig er Whisper Large V3?

Er Whisper Large V3 gratis å bruke?

Hvilket førerkort bruker Whisper Large V3?

Hvor mange språk støtter Whisper Large V3?

Hvor fort er Whisper Large V3?

Hvor stor er Whisper Large V3-modellen?

Hvilke lydformater kan Whisper Large V3 transskribere?

Finner Whisper Large V3 flere høyttalere?

Er mine data private når de bruker Whisper Large V3?

Hvordan sammenlignes 88 000 med andre STT-modeller?

Kan jeg bruke Whisper Large V3 via API?

Kan jeg kjøre Whisper Large V3 på min egen tjener?