Fi pamọ́ Vosk

Name: Vosk
Author: Alpha Cephei

Àwọn iṣẹ́ láti mú àwọn àwòrán àti àwòrán tí a yàn fún gbogbo eniyan. Àwọn àwọn ìròyìn tí a dáwọ́ láti lo DRM kò fọwọ́sì.

Àwọn ìṣàfihàn fún àwọn ìṣàfihàn

Àwọn àkọlé àwọn àkọlé

Fi àkọlé pamọ́

Ṣí àwọn àwọn àgbéwọlé →

Tí fáìlì náà síbẹ̀ tàbí tẹ̀ láti ṣàfihàn

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — to 2GB

Fi àwọn fáìlì mìíràn pamọ́ Àwọn àwọn

Àwọn ìṣàfihàn fún àwọn ìṣàfihàn

Àwọn àkọlé àwọn àkọlé

Fi àkọlé pamọ́

Ṣí àwọn àwọn àgbéwọlé →

Àwọn ìṣàfihàn fún àwọn ìṣàfihàn

Àwọn àkọlé àìpẹ́ láti inú àkọlé. AI kọ̀ọ̀kan-ìṣàmúlò-ètò bí a tí n sọ̀rọ̀ - ìṣàmúlò-ètò náà tí a bá kọ̀ọ̀kan àwọn àkọlé náà.

Àwọn àwọn àmì-ìwé

10 free min/day 600 min ọfẹ pẹlu iforukọsilẹ Kò ní kaadí ẹ̀yàn Àwọn àmì-ìwé

Ṣẹ̀dà nípa ọ̀fẹ̀ →

12.0%

WER

Àwọn Àkọ́lé

100.0x

Ìjánú ìsàlẹ̀-ilà

Apache 2.0

Àwọn Àmì-ìwé

Ààyè-iṣẹ́ Vosk

Vosk ní àwọn àtúntò ìṣàfihàn àwọn àkọlé tí a kò bá ṣiṣẹ́ láìpẹ̀lú ìdàkọ́ kọnputa. Ò ǹfàyé gbàgbà 20+ àwọn ìtàn láti ní àwọn àwọn módè́lì tí a lè rọ́ọ̀nù lórí àwọn àpá-iṣẹ́ móbílì, Raspberry Pi, àti àwọn pánẹ́ẹ̀lì wòyò. Ò tí a kọ̀ ní pàtó Kaldi àti Zipformer.

Àwọn Vosk

Èdè Gẹ̀ẹ́sì

Èdè Sípáníìṣì

Èdè Faransé

Èdè Jámánì

Edè Ṣáínà

Èdè Jàpáànù

Èdè Kòríà

Èdè Pọtogí

Èdè Lárúbáwá

Èdè Híńdì

Èdè Rọ́ṣíà

Èdè Ítálì

Èdè Dọ́ọ̀ṣì

Èdè Tọọkisi

Èdè Póláǹdì

Èdè Suwidiisi

Èdè Indonéṣíà

Èdè Jetinamu

Èdè Seeki

Èdè Giriki

Àwọn Àlàyé Àwọn

Àwọn Ìṣàmúlò-ètòAlpha Cephei
Àwọn Ìṣàmúlò-ètò-
Àwọn Àmì-ìwéApache 2.0
ÀkóónúMar 2026

Àwọn ìṣàmúlò-ètò àìfàn

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Àwọn Àtòjọ-ẹ̀yàn

Vosk ní móòdù ìṣàfihàn-si-àkọ́kọ́ láti Alpha Cephei. STT.ai ní àwọn awáròyìn Vosk nípa àgbègbè GPU wà láti jẹ́ pé o lè lò láti fi àwọn àwọn ìṣàfihàn rẹ̀ pamọ́ - fi àwòrán àti àwòrán pamọ́ sínú àwọn awáròyìn Vosk láti inú àwọn àwọn awáròyìn móòdù.

On standard benchmarks, Vosk achieves around 12.0% Word Error Rate. Real-world accuracy depends on audio quality, accent, and language; for noisy or accented recordings, expect a few percentage points higher WER.

Vosk runs on STT.ai's free tier — every visitor gets 600 minutes/month at no cost. Paid plans add longer per-file limits, private transcripts, and priority queueing.

Vosk tí a fi pamọ́ láti inú Apache 2.0, ìlàyè ìṣàfilọ́lẹ̀-ìṣílọ́lẹ̀. O lè fi Vosk pamọ́ sípàrà rẹ̀ láti lò nínú àwọn ìṣàfilọ́lẹ̀ wà - gbogbo wọn ní a lè lò nínú iṣẹ́.

Vosk ǹfà àwọn ìtàn 20. Àwọn ìṣàfihàn-ìdáràn àwọn ìtàn tí a fẹ́ fún àwọn ìṣàfihàn àwọn ìranlọwọ; o lè sọ̀rọ̀ nípa ìrànwọ́ fún ìṣàfihàn àwọn ìṣàfihàn àwọn ìṣàfihàn.

Vosk processes audio at about 100.0x real-time on our GPUs. A 1-hour audio file finishes in under 1 minutes; longer files queue and notify by email when done.

Vosk has 50M parameters. Larger models tend to be more accurate but slower; STT.ai hosts Vosk on GPU so the parameter count doesn't affect your client-side performance.

Vosk gba gbogbo àwọn ìrísí-lẹ́tà tí STT.ai ǹfàyè — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, àti àwọn mìíràn. Àwọn ìṣàfilọ́lẹ̀ bí TXT, SRT, VTT, DOCX, JSON, tàbí PDF.

Ya. Ìṣàfilọ́lẹ̀ àwọn àkọlé àwọn àkọlé náà tí wọ́n lọ́wọ́lọ́wọ́ Vosk fún ìṣàfilọ́lẹ̀ gbogbó - àwọn àkọlé àwòrán ní pàtó àwọn àkọlé àwòrán náà nínú àwọn àwọn àkọlé àwòrán.

Yes. Vosk runs in our managed environment — audio is processed and deleted by default and never used for training without explicit opt-in. Pro plans add client-side encryption for transcripts at rest.

Use the compare-stt tool to run Vosk against any other supported model on the same audio — you'll see WER, segment count, speaker labels, and confidence scores side-by-side. The Vosk vs Whisper Large V3 comparison is the most commonly run.

Ya. Ṣàfihàn "vosk" bí àwọn ààtò ìṣàmúlò-ètò módè́èlì lórí àwọn ààtò ìparí iṣẹ́ /v1/transscribe. Python àti Node.js SDKs ní àwọn ààtò ìṣàmúlò-ètò Vosk. Àwọn ààtò API àìfẹ́ ní àwọn ààtò 100 àwọn àkókò/óṣù.

Yes. Because Vosk is Apache 2.0-licensed, you can self-host it. STT.ai's open-source page lists the project repo and weights. Most production teams use our hosted version to skip GPU procurement, model swaps, and ops.

Fi pamọ́ Vosk

Ààyè-iṣẹ́ Vosk

Àwọn Vosk

Àwọn Àlàyé Àwọn

Àwọn ìṣàmúlò-ètò àìfàn

Àwọn Àtòjọ-ẹ̀yàn

Kini Vosk?

Bawo ni Vosk ṣe tọ́?

Njẹ Vosk jẹ ọfẹ lati lo?

Ààyè wo ni Vosk lò?

Ìgbà wo nínú àwọn ìtàn wo ní Vosk ǹfà?

Ìgbà wo ní Vosk jẹ́?

Igbà wo ní módè́lì Vosk náà jẹ́?

Kini àwọn ìrísí-lẹ́tà àwọn orin lè kọ̀ nípa Vosk?

Ń Vosk gbọ́ àwọn ìgbàkọ̀lù àwọn ìgbàkọ̀lù àwọn?

Àwọn àkọlé mìíràn nígbà tí mò bá lo Vosk?

Bawo ni Vosk ṣe yatọ si awọn awoṣe STT miiran?

Mo le lo Vosk nípa API?

Ṣe mo le ṣe Vosk lori sévà mì?