Transcribe with Whisper Large V3

Működik nyilvánosan elérhető audio & video. DRM-védett tartalom nem támogatott.

Frissítés a továbbfejlesztett
Private transcript
Csevegés átirattal
Kinyitni a Pro-val →
Drop fájl itt vagy kattintson a böngészésre
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM maximum 2GB
Több fájl feltöltése (lásd 4. 4 pont)
Frissítés a továbbfejlesztett
Private transcript
Csevegés átirattal
Kinyitni a Pro-val →
Frissítés a továbbfejlesztett
Felvétel: 0:00
Valós idejű Vosk (instant)
Továbbfejlesztett@ info: whatsthis Suttogó (pontos)
Nyilvános linkek: 24h, csak szöveg · Regisztrálj! 7d + audio · Pro magánkapcsolatok esetében

Valós idejű beszéd szöveg. AI automatikus javítások, ahogy beszél A pontosság hosszabb beszéddel javul.

Először teszteld a mikrofonodat.
❤️ Love STT.ai? Tell your friends!
Használtad az ingyenes átirataidat.

Regisztráljon ingyenes, hogy 600 perc / hónap, vagy frissítés korlátlan átiratok.

10 ingyenes min/nap 600 perc ingyenes regisztrációval Nincs hitelkártyája. Titkosított
Regisztrálj ingyen! →
4.2%
WER
99
Languages
8.0x
Speed
MIT
License

About Whisper Large V3

Gyakran ismételt kérdések

Whisper Large V3 egy beszéd-to-text modell OpenAI, STT.ai hosts Whisper Large V3 a mi GPU infrastruktúra, így használhatja anélkül, hogy a saját hardvere feltölti audio vagy videó, és vegye Whisper Large V3 a modell picker.

A standard referenciaértékek, Whisper Large V3 eléri mintegy 4.2%-os Word Error Rate. A valós világ pontossága függ a hangminőség, az akcentus és a nyelv; a zajos vagy kihangsúlyozott felvételek, számíthat néhány százalékponttal magasabb WER.

Whisper Large V3 fut a STT.ai's free level -on minden látogató kap 600 percet/hót ingyen. Fizetett tervek hozzá hosszabb per-file limitek, privát átiratok, és elsőbbségi sorban.

Whisper Large V3 kerül kiadásra MIT, egy engedékeny nyílt forráskódú licenc. Önálló Whisper Large V3 saját hardveren, vagy használja a mi hosted verziónk mind kereskedelmileg használható.

Whisper Large V3 támogatja a 99 nyelvet. Auto-detection kiválasztja a megfelelő nyelvet a legtöbb audio; akkor is megadhatja manuálisan egy kis pontosságú lift.

Whisper Large V3 audiót készít körülbelül 8.0x valós idejű GPU-n. Egy 1 órás audio fájl 7 perc alatt fejeződik be; hosszabb fájlok sorba állnak, és e-mailben értesítik őket.

Whisper Large V3 van 1.55B paraméterek. Nagyobb modellek általában pontosabb, de lassabb; STT.ai hosts Whisper Large V3 a GPU, így a paraméterszám nem befolyásolja az ügyfél-oldal teljesítményét.

Whisper Large V3 minden formátumot elfogad, STT.ai támogatja az MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI és mások. Kimeneti mint TXT, SRT, VTT, DOCX, JSON, vagy PDF.

Igen. A szónoki diarization Whisper Large V3-rel együtt fut minden egyes átirathoz ~ minden hangszórót felcímkéznek, és utána átnevezheted őket a szerkesztőbe.

Igen. Whisper Large V3 fut a mi kezelt környezetben Audio feldolgozzák és törölték alapértelmezésben, és soha nem használják képzés kifejezett opt-in nélkül. Pro tervek hozzá kliens-oldal titkosítását átiratok pihenni.

Használja a összehasonlítani-stt eszköz futtatni Whisper Large V3 ellen bármely más támogatott modell ugyanazon audio ★ látni fogja WER, szegmensszám, hangszóró címkék, és a konfidencia pontszámok oldalról oldalra. A Whisper Large V3 vs Whisper Large V3 összehasonlítás a leggyakrabban fut.

Igen. A Python és a Node.js SDK-k Whisper Large V3 példát tartalmaznak. A Free API-szint 100 percet/hónapot tartalmaz.

Igen. Mivel a Whisper Large V3 MIT engedéllyel rendelkezik, saját maga is üzemeltetheti. STT.ai nyílt forráskódú oldala felsorolja a projekt repo- és súlyait. A legtöbb gyártócsapat a GPU beszerzések, modellswapok és op-ok kihagyására használja a hostált verziónkat.