Ilmoita vika / Ominaisuuspyyntö

Määrää lääkkeellä Vosk

Name: Vosk
Author: Alpha Cephei

Toimii julkisesti saatavilla olevan äänen ja videon kanssa. DRM-suojattua sisältöä ei tueta.

Parannuksia parannuksiin

Yksityinen transkriptio

Juttele transkriptin kanssa

Avaa Pron kanssa →

Jätä tiedosto tähän tai napsauta selataksesi

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM – enintään 2GB

Erä lataa useita tiedostoja Pron kanssa

Parannuksia parannuksiin

Yksityinen transkriptio

Juttele transkriptin kanssa

Avaa Pron kanssa →

Parannuksia parannuksiin

Reaaliaikainen puhe tekstiksi. Tekoäly korjaa automaattisesti puhuessasi – tarkkuus paranee pidemmällä puheella.

Testaa mikrofonisi ensin

10 ilmaista min/päivä 600 min ilmaiseksi ilmoittautumalla Ei luottokorttia Salattu

Rekisteröidy ilmaiseksi →

12.0%

WER

Kielet

100.0x

Nopeus

Apache 2.0

Lisenssi

Tietoja Vosk

Vosk on offline-puheentunnistustyökalukokonaisuus, joka toimii ilman internet-yhteyttä. Se tukee 20:tä kieltä, joissa on kompaktit mallit, jotka voivat toimia mobiililaitteilla, Vadelma Pi:llä ja millä tahansa alustalla. Se on rakennettu Kaldi- ja Zipformer-arkkitehtuureille.

Kieliä tuetaan Vosk

Englanti

Espanja

Ranska

Saksa

Kiina

Japani

Korea

Portugali

Arabia

Hindi

Venäjä

Italia

Hollanti

Turkki

Puola

Ruotsi

Indonesia

Vietnam

Tšekki

Kreikka

Malli-info

PalveluntarjoajaAlpha Cephei
Arkkitehtuuri-
LisenssiApache 2.0
PäivitettyMar 2026

Aiheeseen liittyvät mallit

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Usein kysyttyjä kysymyksiä

Vosk on Alpha Cephei:n puheesta tekstiin -malli. STT.ai isännöi Vosk:ta GPU-infrastruktuurissamme, joten voit käyttää sitä ilman, että varaat omia laitteitasi – lataat äänen tai videon ja valitset Vosk mallinnostolaitteesta.

Standardimittauksissa Vosk saavuttaa noin 8801 prosentin Word Error Rate -arvon. Todellisen maailman tarkkuus riippuu äänenlaadusta, aksentista ja kielestä; äänekkäiden tai korostuneiden äänitteiden osalta WER:n odotetaan olevan muutaman prosenttiyksikön korkeampi.

Vosk kulkee STT.ai:n vapaalla tasolla – jokainen vierailija saa 600 minuuttia aikaa aloittaa ilmaiseksi. Maksetut suunnitelmat lisäävät tiedostojen välisiä rajoja, yksityisiä selostuksia ja jonottamista.

Vosk julkaistaan sallivan avoimen lähdekoodin lisenssin alla. Voit itse isännöidä Vosk:ta omalla laitteistollasi tai käyttää isäntäversiotamme – molemmat ovat kaupallisesti käyttökelpoisia.

Vosk tukee 20 kieltä. Automaattinen havainnointi valitsee oikean kielen useimmille äänille; voit myös määrittää sen manuaalisesti pientä tarkkuusnosturia varten.

Vosk prosessorin äänentoisto noin 100.0x reaaliaikaisesti GPU:issa. Tunnin äänitiedosto valmistuu alle 1 minuutissa, pidempi tiedostojono ja ilmoitus sähköpostitse, kun se on tehty.

Vosk:ssa on 50M parametria. Suuremmat mallit ovat yleensä tarkempia, mutta hitaampia; STT.ai isännöi Vosk:a GPU:ssa, joten parametrien määrä ei vaikuta asiakaspuolen suorituskykyyn.

Vosk hyväksyy jokaisen formaatin STT.ai tukea: MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI ja muut. Tuotos on TXT, SRT, VTT, DOCX, JSON tai PDF.

Kyllä. Kaiuttimen diarisointi kulkee Vosk:n rinnalla jokaista transkriptiota kohden – jokainen puhuja on merkitty, ja voit nimetä sen myöhemmin uudelleen päätoimittajaksi.

Kyllä. Vosk kulkee hallitussa ympäristössämme – ääntä käsitellään ja poistetaan oletuksena, eikä sitä koskaan käytetä harjoitteluun ilman nimenomaista opt-iniä. Pro suunnittelee lisäävänsä asiakaspuolen salauksen selostuksiin levossa.

Verrattuna ensimmäiseen työkaluun voit ajaa Vosk muuta saman äänen avulla tuettua mallia vastaan – näet WER:n, segmentin, kaiuttimen tarroja ja itseluottamuspisteitä vierekkäin. Vosk vs. Whisper Large V3 -vertailu on yleisin.

Kyllä. Määrittele "vosk" mallimuuttujaksi /v1/transcribe-päätetapahtumassa. Python ja Node.js SDKs sisältävät Vosk esimerkkiä. Vapaa API-taso sisältää 100 minuuttia kuukaudessa.

Kyllä. Koska Vosk on Apache 2.0-lisensoitu, voit itse isännöidä sitä. STT.ai:n avoimen lähdekoodin sivulla on listattu projektin repo ja painot. Useimmat tuotantoryhmät käyttävät isäntäversiotamme jättääkseen GPU-hankinnat, mallivaihdot ja opsit väliin.

Määrää lääkkeellä Vosk

Tietoja Vosk

Kieliä tuetaan Vosk

Malli-info

Aiheeseen liittyvät mallit

Usein kysyttyjä kysymyksiä

Mikä on Vosk?

Kuinka tarkka on Vosk?

Onko Vosk ilmaista käyttöä?

Mitä lisenssiä Vosk käyttää?

Kuinka monta kieltä Vosk kannattaa?

Kuinka nopea on Vosk?

Kuinka iso on Vosk-malli?

Mitä ääniformaatteja Vosk voi kirjoittaa?

Havaitseeko Vosk useita puhujia?

Ovatko tietoni yksityisiä, kun käytän Vosk:ta?

Miten Vosk vertautuu muihin STT-malleihin?

Voinko käyttää Vosk API:n kautta?

Voinko ajaa Vosk omalla palvelimellani?