Hibajelentés / feladatkérés

Átírás átírása Vosk

Name: Vosk
Author: Alpha Cephei

Működik nyilvánosan elérhető audio & video. DRM-védett tartalom nem támogatott.

Frissítés a továbbfejlesztett

Privát átirat

Csevegés átirattal

Kinyitni a Pro-val →

Drop fájl itt vagy kattintson a böngészésre

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM maximum 2GB

Több fájl feltöltése (lásd 4. 4 pont)

Frissítés a továbbfejlesztett

Privát átirat

Csevegés átirattal

Kinyitni a Pro-val →

Frissítés a továbbfejlesztett

Valós idejű beszéd szöveg. AI automatikus javítások, ahogy beszél A pontosság hosszabb beszéddel javul.

Először teszteld a mikrofonodat.

10 ingyenes min/nap 600 perc ingyenes regisztrációval Nincs hitelkártyája. Titkosított

Regisztrálj ingyen! →

12.0%

WER

Nyelvek

100.0x

Sebesség

Apache 2.0

Jogosítvány

Körülbelül Vosk

Vosk egy offline beszédfelismerő eszközkészlet, amely működik internetkapcsolat nélkül. Támogatja a 20+ nyelvek kompakt modellek, amelyek futnak mobil eszközök, Raspberry Pi, és bármilyen platform. Beépített Kaldi és Zipformer architektúrák.

Támogatott nyelvek Vosk

Angol

Spanyol

Francia

Német

Kínai

Japán

Koreai

Portugál

Arab

Hindi

Orosz

Olasz

Holland

Török

Lengyel

Svéd

Indonéz

Vietnámi

Cseh

Görög

Mintainformációk

SzolgáltatóAlpha Cephei
Építészet-
JogosítványApache 2.0
FrissítveMar 2026

Kapcsolódó modellek

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Gyakran ismételt kérdések

Vosk egy beszéd-to-text modell Alpha Cephei, STT.ai hosts Vosk a mi GPU infrastruktúra, így használhatja anélkül, hogy a saját hardvere feltölti audio vagy videó, és vegye Vosk a modell picker.

A standard referenciaértékek, Vosk eléri mintegy 12.0%-os Word Error Rate. A valós világ pontossága függ a hangminőség, az akcentus és a nyelv; a zajos vagy kihangsúlyozott felvételek, számíthat néhány százalékponttal magasabb WER.

Vosk fut STT.ai ingyenes Tier · minden látogató kap 600 perc indulni költség nélkül. Fizetett tervek hozzá hosszabb per-file limitek, privát átiratok, és elsőbbségi sorban.

Vosk kerül kiadásra Apache 2.0, egy engedékeny nyílt forráskódú licenc. Önálló Vosk saját hardveren, vagy használja a mi hosted verziónk mind kereskedelmileg használható.

Vosk támogatja a 20 nyelvet. Auto-detection kiválasztja a megfelelő nyelvet a legtöbb audio; akkor is megadhatja manuálisan egy kis pontosságú lift.

Vosk audiót készít körülbelül 100.0x valós idejű GPU-n. Egy 1 órás audio fájl 1 perc alatt fejeződik be; hosszabb fájlok sorba állnak, és e-mailben értesítik őket.

Vosk van 50M paraméterek. Nagyobb modellek általában pontosabb, de lassabb; STT.ai hosts Vosk a GPU, így a paraméterszám nem befolyásolja az ügyfél-oldal teljesítményét.

Vosk minden formátumot elfogad, STT.ai támogatja az MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI és mások. Kimeneti mint TXT, SRT, VTT, DOCX, JSON, vagy PDF.

Igen. A szónoki diarization Vosk-rel együtt fut minden egyes átirathoz ~ minden hangszórót felcímkéznek, és utána átnevezheted őket a szerkesztőbe.

Igen. Vosk fut a mi kezelt környezetben Audio feldolgozzák és törölték alapértelmezésben, és soha nem használják képzés kifejezett opt-in nélkül. Pro tervek hozzá kliens-oldal titkosítását átiratok pihenni.

Használja a összehasonlítani-stt eszköz futtatni Vosk ellen bármely más támogatott modell ugyanazon audio ★ látni fogja WER, szegmensszám, hangszóró címkék, és a konfidencia pontszámok oldalról oldalra. A Vosk vs Whisper Large V3 összehasonlítás a leggyakrabban fut.

Igen. A Python és a Node.js SDK-k Vosk példát tartalmaznak. A Free API-szint 100 percet/hónapot tartalmaz.

Igen. Mivel a Vosk Apache 2.0 engedéllyel rendelkezik, saját maga is üzemeltetheti. STT.ai nyílt forráskódú oldala felsorolja a projekt repo- és súlyait. A legtöbb gyártócsapat a GPU beszerzések, modellswapok és op-ok kihagyására használja a hostált verziónkat.

Átírás átírása Vosk

Körülbelül Vosk

Támogatott nyelvek Vosk

Mintainformációk

Kapcsolódó modellek

Gyakran ismételt kérdések

Mi az a Vosk?

Mennyire pontos Vosk?

A Vosk használható?

Milyen licencet használ Vosk?

Hány nyelvet támogat a Vosk?

Milyen gyors a Vosk?

Mekkora a Vosk-es modell?

Milyen hangformátumokat tud Vosk átírni?

A Vosk több hangszórót érzékel?

Az adataim privátak, amikor Vosk-et használok?

Hogyan hasonlítja össze a Vosk-et más STT-modellekkel?

Használhatom a Vosk-et az API-n keresztül?

Lefuttathatom Vosk-et a saját szerveremen?