తో ట్రాన్స్‌క్రైబ్ Vosk

అందుబాటులోవున్న ఆడియో & వీడియోలతో పనిలకు మద్దతు లేదు. DRM- widget- variable or variables కొరకు సహాయం లేదు. Name

ఉన్నతీకరించబడిన కొరకు ఉన్నతీకరించబడింది
Private transcript
మెటాడేటాతో చాట్ చెయండి
OP తో లాక్‌చేయుముDescription →
ఇక్కడ దస్త్రాన్ని పడవేయుము లేదా బ్రౌజ్ చేయుటకు నొక్కుము
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, వెబ్‌నోడ్‌, 2GB
ఉన్నతీకరించబడిన కొరకు ఉన్నతీకరించబడింది
Private transcript
మెటాడేటాతో చాట్ చెయండి
OP తో లాక్‌చేయుముDescription →
ఉన్నతీకరించబడిన కొరకు ఉన్నతీకరించబడింది
రికార్డింగు: 0:00
రియల్ సమయం వోస్క్ (అంధం)
అభివృద్దిచేయబడిన విస్పర్ (సరిష్ట)
సాధారణ లింకులు: 24h, వచనము మాత్రమే · అప్ సంతకం 7d + ఆడియో కొరకు · పధ్ధతి వ్యక్తిగత లింకులు కొరకు

టెక్స్‌చర్‌తో వాస్తవమైన మాటలు. మీరు చెబుతున్నట్లుగా ఆటో- సరిచెయళ్ళు —⁠ ఖచ్చితత్వం పొడవైన మాటలతో మెరుగవుతుంది.

మొదట మీ మైక్రోఫోన్‌ను పరీక్షించండిName
❤️ ప్రేమ STTi.i మీ స్నేహితులకు చెప్పండి!
మీరు మీ ఉచిత అసమ్మతిలను ఉపయోగిస్తున్నారు

600 నిమిషాలు/ నెలకు పొందుటకు, లేదా పరిమితమైన అంకెలను ఉన్నతీకరించడానికి కు సంతకం.

10 ఖాళీ నిమిషాల/ రోజు 600 నిమిషాల సంజ్ఞతో ఖాళీ క్రెడిట్ కార్డు లేదు ఎన్క్రిప్షన్ చేయబడింది
ఉచితముగా అప్ సంతకం →
12.0%
WER
20
Languages
100.0x
Speed
Apache 2.0
License

గురించి Vosk

Vosk is an offline speech recognition toolkit that works without an internet connection. It supports 20+ languages with compact models that can run on mobile devices, Raspberry Pi, and any platform. Built on Kaldi and Zipformer architectures.

తరచుగా అడిగే ప్రశ్నలు

Vosk ఒక భాషా-text నమూనా 8882.STT.ai హార్డ్వేర్లను మీ స్వంత సదుపాయం లేకుండా దీన్ని ఉపయోగించవచ్చు కాబట్టి మీరు మీ సొంత హార్డ్వేర్లు — అప్లోడ్ లేదా వీడియో ఎంచుకోండి మరియు మాదిరి నుండి Vosk ఎంపిక.

ప్రామాణిక బెంచ్‌మార్క్స్ లో Vosk వర్సెస్ 12.0 శాతము పదకోశం తప్పు రేటు చుట్టూ వుంటోంది. నిజమైన- లోక ఖచ్చితత్వం ఆడియో నాణ్యత, ఉచ్చారణ, భాషపై ఆధారపడి ఉంటుంది. శృంగారింపు లేదా ఉద్దీపన రికార్డింగుల కోసం కొన్ని శాతం ఎక్కువ పాయింట్లు ఆశిస్తున్నాము.

Vosk STT.ai యొక్క ఉచిత టైర్ న నడుస్తుంది ప్రతి సందర్శకులకు ఖర్చు లేకుండా 600 నిమిషాలు/ నెలలు లభిస్తుంది. పాడ్ ప్రణాళికలు ఒక file పరిమితి, వ్యక్తిగత అప్రమత్తత మరియు ప్రాధాన్యత క్రమం చేర్చండి.

Apache 2.0 కింద Vosk విడుదల చేయబడుతుంది. మీరు మీ సొంత హార్డ్వేర్ Vosk లో స్వీయ - హోస్ట్ Vosk చేయవచ్చు లేదా మా హోస్ట్ వెర్షన్ వెర్షన్ ఉపయోగించవచ్చు. రెండు ఉత్సుకంగాఅనుకూలంగా ఉంటాయి.

Vosk భాషలు 20 భాషలకు మద్దతిస్తుంది. చాలా పెద్ద ఆడియో కొరకు సరైన భాషను స్వయంచాలకంగా తనిఖీ చేయవచ్చు; మీరు దీనిని ఒక చిన్న ఖచ్చిత వ్రైడ్ కోసం కూడా కేటాయించవచ్చు.

మా GPUS న 880x రియల్లేమ్ Vosk ప్రక్రియల సమయంలో ఆడియో రియల్. ఒక 1- గంటల ఆడియో ఫైల్ ముగుస్తుంది 882 నిమిషాల క్రింద; ఎక్కువ దస్త్రాలు వరుసలో క్రమంలో మరియు ఈమెయిల్ ద్వారా తెలియజేయబడుతుంది.

Vosk దగ్గర 8802 గణాంకాలు ఉంటాయి. పెద్ద మోడల్ మరింత ఖచ్చితమైనవి కానీ వేగం తక్కువగా ఉంటుంది. STT.ai హోస్ట్లు; GPU న 8Vosk పై వుపతాణ కౌంట్ మీ క్లైంట్ యొక్క సౌలభ్యాను ప్రభావితం లేదు.

8801 ప్రతి ఫాధైర్య STT.ai మద్దతులను అంగీకరిస్తుంది —⁠ MP3, WAV, MAG, OGG4, MCV, MOV, MOV, వెబ్‌నో, AVI, మరియు ఇతర. అవుట్‌పుట్ TXT, SRT, DOT, DOT, DCX, JSX, JSC, లేదా PDF గా.

ఆ తర్వాత మీరు వాటిని పరిణామక్రమంలో రాసుకోవచ్చు.

Vosk మన కృత్రిమ వాతావరణంలో నడుస్తుంది —⁠ ఆడియో అప్రమేయంగా ప్రక్రియ మరియు తీసివేయబడుతుంది మరియు ఎటువంటి విస్తీర్ణత లేకుండా శిక్షణ కోసం ఎప్పుడూ. ప్రోగ్రాంలు రికేషన్స్ కోసం క్లైంట్- వైపు నినాప్ చేర్చండి.

అదే ఆడియోనందు మ్యాచ్‌డ్‌డ్ Vosk మ్యాచ్‌డ్‌ను నడుపుటకు పోల్చు-tt ఉపకరణాన్ని వుపయోగించుము —⁠ మీరు WER, భాగపు కౌంటీ కౌంటర్, స్పీకర్ లేబుల్స్, మరియు నమ్మదగ్గ స్కోర్‌లను ప్రక్కకు చూస్తారు. Vosk vs Whisper v1 పెద్ద V3 పోల్చు సర్వసాధారణంగా నడుపుతుంది.

. i అవును, "8000" ను /v1/trainch కు నమూనా అంశంగా గుర్తించుము. Python మరియు SDKs. 8801 ఉదాహరణలు కలిగివుంటుంది. ఫ్రీ API టైకర్ 100 minutes కలిగివుంటుంది.

Vosk ఉంది ఎందుకంటే Apache 2.0-licented ఉంది, మీరు స్వీయ-పోర్టర్లను చేయవచ్చు STT.ai యొక్క ఓపెన్ పేజీ ప్రాజెక్టు repo మరియు బరువులను జాబితాలో ఉంది. చాలా ఉత్పత్తి బృందం GPU బృందం GPU బృందం, మాదిరి బదిలీలు మరియు ops కోసం మా వుడ్ వెర్షన్ వెర్షన్ ఉపయోగిస్తారు.