Rapportér fejl / funktionsanmodning

Transskriber med Whisper Large V3

Name: Whisper Large V3
Author: OpenAI

Fungerer med offentligt tilgængelig lyd og video. DRM- beskyttet indhold understøttes ikke.

Opgradering til forbedret

Privat udskrift

Chat med udskrift

Lås op med Pro →

Slip fil her eller klik for at gennemse

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM ~ op til 2GB

Batch uploade flere filer med Pro

Opgradering til forbedret

Privat udskrift

Chat med udskrift

Lås op med Pro →

Opgradering til forbedret

Real-time tale til tekst. AI auto-korrigerer som du taler nøjagtighed forbedrer med længere tale.

Test din mikrofon først

10 gratis min/dag 600 min fri med tilmelding Intet kreditkort Krypteret

Tilmeld dig gratis →

4.2%

WER

Sprog

8.0x

Hastighed

MIT

Licens

Om Whisper Large V3

Whisper Large V3 er OpenAI flagskib open source talegenkendelse model. Med 1,55 milliarder parametre, det giver enestående nøjagtighed på tværs af 99 sprog. Det bruger en transformer encoder-dekoder arkitektur uddannet på 680.000 timers flersprogede lyddata.

Sprog understøttet af Whisper Large V3

Engelsk

Spansk

Fransk

Tysk

Kinesisk

Japansk

Koreansk

Portugisisk

Arabisk

Hindi

Russisk

Italiensk

Nederlandsk

Tyrkisk

Polsk

Svensk

Indonesisk

Thai

Vietnamesisk

Tjekkisk

Græsk

Rumænsk

Ungarsk

Hebraisk

Dansk

Finsk

Norsk

Ukrainsk

Malajisk

Bengali

Modelinformation

LeverandørOpenAI
Arkitektur-
LicensMIT
OpdateretMar 2026

Relaterede modeller

3.2% WER

5.1% WER

3.5% WER

7.8% WER

3.0% WER

Ofte stillede spørgsmål

Whisper Large V3 er en tale-til-tekst model af OpenAI. STT.ai værter Whisper Large V3 på vores GPU-infrastruktur, så du kan bruge det uden at give din egen hardware uploade lyd eller video og vælge Whisper Large V3 fra modelvælgeren.

På standard benchmarks, Whisper Large V3 opnår omkring 4.2% Word Error Rate. Real-verden nøjagtighed afhænger af lydkvalitet, accent og sprog; for støjende eller accent optagelser, forventer et par procentpoint højere WER.

Whisper Large V3 kører på STT.ai gratis niveau ! hver besøgende får 600 minutter til at starte uden omkostninger. Betalt planer tilføje længere per-fil grænser, private udskrifter, og prioritet kø.

Whisper Large V3 er udgivet under MIT, en permissiv open source licens. Du kan selvvært Whisper Large V3 på din egen hardware eller bruge vores hosted version! begge er kommercielt brugbare.

Whisper Large V3 understøtter 99 sprog. Auto-detektering vælger det rigtige sprog til de fleste lyd; du kan også angive det manuelt for en lille nøjagtighed elevator.

Whisper Large V3 behandler lyd på omkring 8.0x realtid på vores GPU'er. En 1-timers lydfil slutter på under 7 minutter; længere filer kø og underrette via e-mail, når det er gjort.

Whisper Large V3 har 1.55B parametre. Større modeller har tendens til at være mere præcise, men langsommere; STT.ai værter Whisper Large V3 på GPU, så parameteren tæller ikke påvirker din klient-side ydeevne.

Whisper Large V3 accepterer hvert format STT.ai understøtter ~ MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, og andre. Output som TXT, SRT, VTT, DOCX, JSON, eller PDF.

Ja. Speaker diarization kører sammen med Whisper Large V3 for hver transskription! hver højttaler er mærket, og du kan omdøbe dem i editoren bagefter.

Ja. Whisper Large V3 kører i vores administrerede miljø ~ lyd behandles og slettes som standard og aldrig bruges til træning uden eksplicit opt-in. Pro planer tilføje klient-side kryptering for udskrifter på hvile.

Brug sammenligning-stt værktøj til at køre Whisper Large V3 mod enhver anden understøttet model på den samme lyd! du vil se WER, segment tæller, højttaler etiketter, og tillid scorer side om side. Whisper Large V3 vs Whisper Stor V3 sammenligning er den mest almindelige køre.

Ja. Angiv "whisper-large-v3" som modelparameter på /v1/transcribe endpoint. Python og node.js SDKs omfatter Whisper Large V3 eksempler. Gratis API-niveau inkluderer 100 minutter/måned.

Ja. Fordi Whisper Large V3 er MIT-licenseret, kan du selv være vært for det. STT.ai open source side viser projektet repo og vægte. De fleste produktionshold bruger vores hosted version til at springe GPU indkøb, model swaps og ops.

Transskriber med Whisper Large V3

Om Whisper Large V3

Sprog understøttet af Whisper Large V3

Modelinformation

Relaterede modeller

Ofte stillede spørgsmål

Hvad er Whisper Large V3?

Hvor nøjagtig er Whisper Large V3?

Er Whisper Large V3 gratis at bruge?

Hvilken licens bruger Whisper Large V3?

Hvor mange sprog understøtter Whisper Large V3?

Hvor hurtigt er Whisper Large V3?

Hvor stor er Whisper Large V3-modellen?

Hvilke lydformater kan Whisper Large V3 transskribere?

Opdager Whisper Large V3 flere højttalere?

Er mine data private, når du bruger Whisper Large V3?

Hvordan kan Whisper Large V3 sammenlignes med andre STT-modeller?

Kan jeg bruge Whisper Large V3 via API?

Kan jeg køre Whisper Large V3 på min egen server?