Transcribe with Vosk

Töötab avalikult kättesaadava audio & videoga. DRM- ga kaitstud sisu ei ole toetatud.

Täiustatud täiustamine
Private transcript
Vestlus ärakirjaga
Ava koos Pro' ga →
Faili viskamine siia või klõpsa sirvimiseks
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM ~ kuni 2GB
Täiustatud täiustamine
Private transcript
Vestlus ärakirjaga
Ava koos Pro' ga →
Täiustatud täiustamine
Salvestamine: 0:00
Reaalajas Vosk (instant)
Täiustatud Whisper (täpsus)
Avalikud lingid: 24h, ainult tekst · Registreeru 7d + audio · Pro privaatsete linkide jaoks

Reaalajas kõne teksti. AI automaatkorrektsioonid rääkides paraneb pikema kõnega.

Testige kõigepealt oma mikrofoni.
❤️ Armastus STT.ai?
Sa oled kasutanud oma tasuta transkriptsioone.

Registreeru tasuta saada 600 minutit / kuus, või uuendada piiramatu transkriptsiooni.

10 vaba minutit päevas 600 min tasuta registreerumisega Krediitkaarti pole Krüptitud
Registreeru tasuta →
12.0%
WER
20
Languages
100.0x
Speed
Apache 2.0
License

About Vosk

Korduma kippuvad küsimused

Vosk on kõne-teksti mudel Alpha Cephei. STT.ai hosts Vosk meie GPU infrastruktuuri, nii et saate seda kasutada ilma oma riistvara ~ üles laadida audio või video ja valida Vosk mudeli valija.

Standardsete võrdlusandmete puhul saavutab Vosk Wordi veamäära ligikaudu 12.0%. Reaalmaailma täpsus sõltub heli kvaliteedist, aktsendist ja keelest; lärmakate või aktsendiga salvestuste puhul oodake mõnda protsendipunkti kõrgemat WER-i.

Vosk töötab STT.ai vaba tase ~ iga külastaja saab 600 minutit kuus tasuta. Tasulised plaanid lisada enam ühe faili piirangud, era ärakirju, ja prioriteet järjekorda.

Vosk vabastatakse all Apache 2.0, lubatud avatud lähtekoodiga litsentsi. Võite ise-host Vosk oma riistvara või kasutada meie võõrustatud versioon ~ Mõlemad on kaubanduslikult kasutatavad.

Vosk toetab 20 keelt. Automaatne tuvastamine valib enamiku audio jaoks õige keele; seda saab ka käsitsi määrata väikese täpsuse tõstmiseks.

Vosk töötleb audio umbes 100.0x reaalajas meie GPUs. 1-tunnine audiofail lõpetab alla 1 minutit; pikem faile järjekorda ja teatada e-posti teel, kui tehtud.

Vosk on 50M parameetrid. Suuremad mudelid kipuvad olema täpsem, kuid aeglasem; STT.ai hosts Vosk on GPU nii parameeter arv ei mõjuta oma kliendi poolel jõudlust.

Vosk aktsepteerib iga formaat STT.ai toetab ~ MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, jt. Väljund TXT, SRT, VTT, DOX, JSON, või PDF.

Jah. Spiiker diarization töötab kõrvuti Vosk iga transkriptsioon ~ iga kõneleja on märgistatud ja saate ümber nimetada neid toimetaja hiljem.

Jah. Vosk jookseb meie hallatav keskkond ~ audio on töödeldud ja kustutatud vaikimisi ja kunagi kasutada koolitus ilma selge opt-in. Pro plaanid lisada kliendipoolne krüptimine transkriptid puhkeolekus.

Kasutage võrdlus-stt tööriist käivitada Vosk vastu teiste toetatud mudeli sama audio ~ näete WER, segment arv, kõlari sildid, ja enesekindluse skoor külg-küljelt. Vosk vs Whisper Large V3 võrdlus on kõige sagedamini käivitada.

Jah. Täpsustada "vosk" mudeli parameeter /v1/transcrip tulemusnäitaja. Python ja Node.js SDKs sisaldavad Vosk näited. Tasuta API tase sisaldab 100 minutit/kuus.

Jah. Kuna Vosk on Apache 2.0-litsentsiga, saate ise-host seda. STT.ai avatud lähtekoodiga lehekülg loetleb projekti repo ja kaalud. Enamik tootmismeeskonnad kasutavad meie võõrustatud versiooni vahele GPU hanke, mudeli vahetuste ja operatsioonide.