Transcribe with Whisper Large V3

Arbeider med offentlig tilgjengelig lyd og video. DRM- beskyttet innhold er ikke støttet.

Oppgradering for forbedret
Private transcript
Chat med utskrift
Lås opp med Pro →
Slipp fil her eller trykk for å bla gjennom
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — opptil 2GB
Oppgradering for forbedret
Private transcript
Chat med utskrift
Lås opp med Pro →
Oppgradering for forbedret
Opptak: 0:00
Sanntid Vosk (intant)
Forbedret Visking (nøyaktig)
Offentlige lenker: 24h, bare tekst · Registrer deg i 7d + lyd · Pro til private lenker

Sanntidstale til tekst. AI korrigerer automatisk mens du snakker – nøyaktighet forbedres med lengre tale.

Test mikrofonen din først
❤️ Kjærlighet STT.ai?
Du har brukt dine frie utskrifter

Gratis tilmelding for å få 600 minutter/måned, eller oppgradering for ubegrenset utskrifter.

10 gratis min/dag 600 min fri med registrering Intet kredittkort Kryptert
Registrer deg gratis →
4.2%
WER
99
Languages
8.0x
Speed
MIT
License

About Whisper Large V3

Ofte stilte spørsmål

Whisper Large V3 er en tale-til-tekst-modell av OpenAI. STT.ai er verter Whisper Large V3 på vår GPU-infrastruktur slik at du kan bruke den uten å skaffe til veie din egen maskinvare – last opp lyd eller video og velg Whisper Large V3 fra modellvelgeren.

Med standard standardverdier oppnår 88 000 omtrent 4.2% ordfeilrate. Nøyaktighet i den virkelige verden avhenger av lydkvalitet, aksent og språk. For opptak med støy eller aksent, forvent noen prosentpoeng høyere WER.

Whisper Large V3 kjører på STT.ais frie nivå – hver besøkende får 600 minutter/ måned uten kostnad. Betalte planer legger til lengre filgrenser, private utskrifter og prioritetskøing.

Whisper Large V3 er frigitt under MIT, en ettergivende åpen kildekode- lisens. Du kan selv være vert Whisper Large V3 på din egen maskinvare eller bruke vår vertsversjon – begge kan brukes kommersielt.

Whisper Large V3 støtter 99 språk. Auto- deteksjon velger det riktige språket for de fleste lydene. Du kan også oppgi det manuelt for en liten presisjonsheis.

Whisper Large V3 behandler lyd ved omlag 8.0x i sanntid på våre GPU- er. En en- times lydfil er ferdig på under 7 minutter, lengre filkø og varsles med e- post når den er ferdig.

Whisper Large V3 har 1.55B parametre. Større modeller har en tendens til å være mer presise men langsommere. STT.ai er verter Whisper Large V3 på GPU så parametertallet påvirker ikke din ytelse på klientsiden.

Whisper Large V3 godtar alle format STT.ai støtter – MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI og andre. Utdata som TXT, SRT, VTT, DOCX, JSON eller PDF.

Ja. Høytalerdiarisering går sammen med Whisper Large V3 for hver utskrift – hver høyttaler er merket og du kan endre navn på dem i redigeringen etterpå.

Ja. Whisper Large V3 kjører i vårt styrte miljø – lyd behandles og slettes som standard og brukes aldri til trening uten eksplisitt valg. Pro planer legger til kryptering på klientsiden for utskrifter i hvile.

Bruk sammenlikningsverktøyet til å kjøre Whisper Large V3 mot alle andre modeller som støttes på samme lyd – du får se WER, segmenttelling, høyttal og tillitspoeng side om side. Sammenlikningen Whisper Large V3 mot Whisper Stor V3 er det vanligste kjøreverktøyet.

Ja. Oppgi « whisper-large-v3 » som modellparameter for sluttpunktet / v1/ trancribe. Python og Node. js SDK inkluderer Whisper Large V3 eksempler. Free API- nivå inkluderer 100 minutter/ måned.

Ja, fordi Whisper Large V3 er MIT-lisensert, kan du selv være vert for det. STT.ai-tallets åpen-kildekode side lister prosjektet repo og vekter. de fleste produksjonsteam bruker vår vertsversjon til å hoppe over GPU innkjøp, modellbytteavtaler og ops.