Pranešti apie klaidą / funkcijų užklausą

Atsekti Whisper Large V3

Name: Whisper Large V3
Author: OpenAI

Veikia su viešai prieinama garso ir vaizdo medžiaga. DRM apsaugotas turinys nepalaikomas.

Atnaujinti tobulinimui

Privatus stenograma

Pokalbis su stenograma

Atrakinti su Pro →

Numeskite failą čia arba spustelėkite norėdami naršyti

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM – iki 2GB

Partijos įkelti kelis failus su Pro

Atnaujinti tobulinimui

Privatus stenograma

Pokalbis su stenograma

Atrakinti su Pro →

Atnaujinti tobulinimui

Kalbėjimas realiu laiku su tekstu. AIS auto-korekcija, kai jūs kalbate — tikslumas pagerina ilgiau kalba.

Pirmiausia patikrinkite mikrofoną

10 nemokamų min. per dieną 600 min be registracijos Nėra kredito kortelės Šifruojama

Užsiregistruoti nemokamai →

4.2%

WER

Kalbos

8.0x

Greitis

MIT

Licencija

Apie Whisper Large V3

Whisper didelis V3 yra atvirojo kodo kalbos atpažinimo modelis. Su 1,55 milijardo parametrų, jis suteikia išskirtinį tikslumą 99 kalbomis. Jis naudoja transformatoriaus koder-dekoder architektūra apmokytas 680,000 valandų daugiakalbių garso duomenų.

Kalbos remiamos Whisper Large V3

Anglų

Ispanų

Prancūzų

Vokiečių

Kinų

Japonų

Korėjiečių

Portugalų

Arabų

Hindi

Rusų

Italų

Olandų

Turkų

Lenkų

Švedų

Indoneziečių

Tajų

Vietnamiečių

Čekų

Graikų

Rumunų

Vengrų

Hebrajų

Danų

Suomių

Norvegų

Ukrainiečių

Malajiečių

Bengalų

Pavyzdinės informacijos

TeikėjasOpenAI
Architektūra-
LicencijaMIT
AtnaujintaMar 2026

Susiję modeliai

3.2% WER

5.1% WER

3.5% WER

7.8% WER

3.0% WER

Dažnai užduodami klausimai

Whisper Large V3 yra kalbos-teksto modelis iki OpenAI. STT.ai savo GPU infrastruktūroje sumontuoti Whisper Large V3, todėl jį galite naudoti neįrengdami savo techninės įrangos – įkelkite garso ar vaizdo ir pasirinkite Whisper Large V3 iš modelio parinkiklis.

Dėl standartinių lyginamųjų standartų, Whisper Large V3 pasiekia apie 8801% Word error Rate. Realaus pasaulio tikslumas priklauso nuo garso kokybės, akcentas, ir kalba; Triukšmingų ar akcentuotų įrašų, tikėtis keletą procentinių punktų didesnis WER.

Whisper Large V3 veikia STT.ai laisvų pakopų – kiekvienas lankytojas gauna 600 minučių pradėti be jokios kainos. Mokami planai pridėti daugiau per failą ribų, privačių stenogramų, ir prioritetinių eilė.

Whisper Large V3 yra išleistas pagal MIT, leistina atviro kodo licencija. Galite savarankiškai-host Whisper Large V3 ant savo aparatūros arba naudoti mūsų palaikomą versiją - abu yra komerciškai naudoti.

Whisper Large V3 palaiko 99 kalbas. Automatinis aptikimas pasirenka reikiamą kalbą daugumai garso; taip pat galite nurodyti ją rankiniu būdu nedideliam tikslumui pakelti.

Whisper Large V3 apdoroja garsą maždaug 8.0x realiu laiku mūsų GPU. 1 valandos garso failas baigiasi po 7 minučių; ilgesnis failų eilė ir apie tai praneš el. paštu, kai tai bus padaryta.

Whisper Large V3 turi 1.55B parametrus. Didesni modeliai yra tikslesni, bet lėčiau; STT.ai GPU mazgai Whisper Large V3, todėl parametrų skaičius neturi įtakos Jūsų klientų veiklos rezultatams.

Whisper Large V3 priima kiekvieną formatą STT.ai palaiko: MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI ir kt. Išvesti kaip TXT, SRT, VTT, DOCX, JSON, arba PDF.

Taip. Garsiakalbio diarizacija veikia šalia Whisper Large V3 kiekvienam transkripcija – kiekvienas garsiakalbis yra pažymėtas ir galite pervadinti juos redaktoriuje po to.

Taip. Whisper Large V3 veikia mūsų valdomoje aplinkoje — garso yra apdorojamas ir ištrinamas pagal nutylėjimą ir niekada naudojamas mokymui be aiškaus opt-in. Pro planai pridėti kliento pusėje šifravimo stenogramos poilsio.

Naudokite palyginimo-stt įrankis paleisti Whisper Large V3 prieš bet kurį kitą palaikomą modelį tame pačiame garso — pamatysite WER, segmentų skaičių, garsiakalbių etiketes ir pasitikėjimo balus šalia-by-by. Whisper Large V3 palyginti Whisper didelis V3 yra dažniausiai paleisti.

Taip. Nurodykite "whisper-large-v3" kaip modelio parametrą /v1/tractor parametrą. Python ir Node.js SDK yra Whisper Large V3 pavyzdžiai. Nemokama API pakopa apima 100 minučių/mėnesį.

Taip. Kadangi Whisper Large V3 yra MIT-licencijuotas, galite patys-host jį. STT.ai atviro kodo puslapis išvardija projekto atpirkimo ir svorius. Dauguma gamybos komandos naudoja mūsų įdiegtą versiją praleisti GPU pirkimų, modelių apsikeitimo, ir ops.

Atsekti Whisper Large V3

Apie Whisper Large V3

Kalbos remiamos Whisper Large V3

Pavyzdinės informacijos

Susiję modeliai

Dažnai užduodami klausimai

Kas yra Whisper Large V3?

Kiek tikslūs yra Whisper Large V3?

Ar Whisper Large V3 laisva naudoti?

Kokią licenciją naudoja Whisper Large V3?

Kiek kalbų palaiko Whisper Large V3?

Kaip greitai yra Whisper Large V3?

Kiek didelis yra Whisper Large V3 modelis?

Kokie garso formatai gali perrašyti Whisper Large V3?

Ar Whisper Large V3 aptikti kelis garsiakalbius?

Ar mano duomenys privatūs naudojant Whisper Large V3?

Kaip palyginti su kitais STT modeliais Whisper Large V3?

Ar galiu naudoti Whisper Large V3 per API?

Ar galiu paleisti Whisper Large V3 savo serveryje?