Transcribe with Vosk

Radi s javno dostupnim audio & video. DRM zaštićeni sadržaj nije podržan.

Nadogradnja za poboljšanje
Private transcript
Čavrljaj s transkriptom
Otključaj pomoću pro →
Ispustite datoteku ovdje ili kliknite za pregled
MP3, WAV, M4A, FLAC, MP4, MKV, pokret, WebM — do 2GB
Nadogradnja za poboljšanje
Private transcript
Čavrljaj s transkriptom
Otključaj pomoću pro →
Nadogradnja za poboljšanje
Snimanje: 0:00
Realno vrijeme Vosk (instant)
Povećano Šaputanje (precizno)
Javne veze: 24h, samo tekst · Upišite se za 7d + zvuk · Profesionalno za privatne veze

Realno vrijeme govor na tekst. AI automatski ispravlja dok govorite – preciznost se poboljšava s dužim govorom.

Isprobaj prvo mikrofon
❤️ Love STT.ai? Tell your friends!
Koristio si besplatne transkripcije.

Prijavite se besplatno dobiti 600 minuta/mjesečno, ili nadogradnja za neograničene transkripcije.

10 besplatnih min/dan 600 min besplatno s prijavom Nema kreditne kartice Šifrirano
Upišite se besplatno →
12.0%
WER
20
Languages
100.0x
Speed
Apache 2.0
License

About Vosk

Česta pitanja

Vosk je model govor-na-tekst od Alpha Cephei. STT.ai domaćina Vosk na našoj infrastrukturi GPU tako da ga možete koristiti bez opskrbe vlastitim hardverom – upload audio ili video i odaberite Vosk iz modela birač.

Na standardnim mjerilima, Vosk postiže oko 12.0% Word Pogreška. Preciznost stvarnog svijeta ovisi o kvaliteti zvuka, naglasku i jeziku; za bučne ili naglasene snimke, očekujte nekoliko postotka više WER.

Vosk radi na STT.ai besplatnom nivou – svaki posjetitelj dobiva 600 minuta mjesečno bez troškova. Plaćeni planovi dodati više po datoteci ograničenja, privatne transkripte i prioritet reda.

Vosk je pušten pod Apache 2.0, popustljiva dozvola otvorenog izvora. Možete samostalno voditi Vosk na vlastitom hardveru ili koristiti našu domaću verziju – oboje su komercijalno upotrebljivi.

Vosk podržava 20 jezika. Auto-detekcija bira pravi jezik za većinu zvuka; možete ga također ručno navesti za mali preciznost lift.

Vosk procesa zvuka na oko 100.0x real-time na našem GPU-u. Jedan sat audio datoteka završava u manje od 8802 minuta; duže datoteke redak i obavijestite e-mailom kada se uradi.

Vosk ima 8802 parametra. Veći modeli su točniji, ali sporije; STT.ai domaćina Vosk na GPU tako da broj parametara ne utječe na performanse vašeg klijenta.

Vosk prihvaća svaki oblik STT.ai podrške — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI i ostali. Izlaz kao TXT, SRT, VTT, DOCX, JSON, ili PDF.

Da. Zvučnička dijarizacija teče uz Vosk za svaku transkripciju — svaki govornik je označen i možete ih nakon toga preimenovati u uredniku.

Da. Vosk trči u našem upravljanom okruženju – audio se obrađuje i briše uobičajeno i nikada se ne koristi za trening bez eksplicitne opt-in. Pro planovi dodati klijent-strana enkripcija za transkripte u miru.

Koristite alat usporedbe-stt za pokretanje Vosk protiv bilo kojeg drugog podržanog modela na istom zvuku – vidjet ćete WER, broj segmenta, zvučnike, i samopouzdanje rezultate strane-ba-side. Vosk protiv Whisper Veliki V3 usporedba je najčešće pokrenuti.

Da. Navedite "vosk" kao parametar modela na /v1/transcribe ishodu. Python i Node.js SDKs uključuju Vosk primjera. Besplatni API stupanj uključuje 100 minuta/mjesec.

Da. Budući da je Vosk je 8802-licensirana, možete ga samostalno voditi. STT.ai stranica otvorenog izvora popisuje repo i utege projekta. Većina proizvodnih timova koristi našu domaćinu za preskočenje GPU nabave, modela swaps, i ops.