Αναφορά σφάλματος / αίτησης χαρακτηριστικών

Ημερολόγιο με Vosk

Name: Vosk
Author: Alpha Cephei

Λειτουργεί με δημόσια διαθέσιμα ήχου & βίντεο. DRM-προστατευμένο περιεχόμενο δεν υποστηρίζεται.

Αναβάθμιση για Ενισχυμένη

Ιδιωτικό χειρόγραφο

Συνομιλία με τα πρακτικά

Ξεκλείδωμα με Pro →

Αφήστε το αρχείο εδώ ή κάντε κλικ για να περιηγηθείτε

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM

Latch upload multiple files με Pro

Αναβάθμιση για Ενισχυμένη

Ιδιωτικό χειρόγραφο

Συνομιλία με τα πρακτικά

Ξεκλείδωμα με Pro →

Αναβάθμιση για Ενισχυμένη

Ο λόγος σε πραγματικό χρόνο στο κείμενο. AI auto-διορθώνει καθώς μιλάτε ~ Ακρίβεια βελτιώνεται με μεγαλύτερη ομιλία.

Δοκιμάστε το μικρόφωνο σας πρώτα

10 δωρεάν λεπτά/ημέρα 600 λεπτά δωρεάν με εγγραφή Χωρίς πιστωτική κάρτα Κρυπτογραφημένο

Εγγραφείτε δωρεάν →

12.0%

WER

Γλώσσες

100.0x

Ταχύτητα

Apache 2.0

Άδεια

Σχετικά Vosk

Το Vosk είναι ένα offline εργαλείο αναγνώρισης ομιλίας που λειτουργεί χωρίς σύνδεση στο διαδίκτυο. Υποστηρίζει 20+ γλώσσες με συμπαγή μοντέλα που μπορούν να τρέξουν σε κινητές συσκευές, Raspberry Pi, και οποιαδήποτε πλατφόρμα.

Γλώσσες που υποστηρίζονται από Vosk

Αγγλικά

Ισπανικά

Γαλλικά

Γερμανικά

Κινεζικά

Ιαπωνικά

Κορεατικά

Πορτογαλικά

Αραβικά

Χίντι

Ρωσικά

Ιταλικά

Ολλανδικά

Τουρκικά

Πολωνικά

Σουηδικά

Ινδονησιακά

Βιετναμικά

Τσεχικά

Ελληνικά

Υπόδειγμα πληροφοριών

ΠρομηθευτήςAlpha Cephei
Αρχιτεκτονική-
ΆδειαApache 2.0
ΕνημερώθηκεMar 2026

Σχετικά Μοντέλα

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Συχνές Ερωτήσεις

Vosk είναι ένα μοντέλο ομιλίας προς κείμενο από Alpha Cephei. STT.ai φιλοξενεί Vosk για την υποδομή GPU μας, ώστε να μπορείτε να το χρησιμοποιήσετε χωρίς να παρέχει το δικό σας υλικό? Ανεβάστε τον ήχο ή το βίντεο και επιλέξτε Vosk από το μοντέλο picker.

Στα πρότυπα σημεία αναφοράς, Vosk επιτυγχάνει περίπου 12.0% Word Error Rate. Ακρίβεια σε πραγματικό κόσμο εξαρτάται από την ποιότητα ήχου, την προφορά, και τη γλώσσα? για θορυβώδη ή τονισμένη ηχογραφήσεις, αναμένουν μερικές ποσοστιαίες μονάδες υψηλότερη WER.

Vosk τρέχει με STT.ai δωρεάν βαθμίδα

Vosk κυκλοφορεί κάτω από Apache 2.0, μια ανεκτική άδεια ανοικτού κώδικα. Μπορείτε να αυτο-φιλοξενήσετε Vosk στο δικό σας υλικό ή να χρησιμοποιήσετε μας φιλοξενείται έκδοση και τα δύο είναι εμπορικά χρησιμοποιήσιμα.

Vosk υποστηρίζει 20 γλώσσες. Auto-detection επιλέγει τη σωστή γλώσσα για τους περισσότερους ήχους? μπορείτε επίσης να το καθορίσετε χειροκίνητα για ένα μικρό ανελκυστήρα ακρίβειας.

Vosk διαδικασίες ήχου σε περίπου 100.0x σε πραγματικό χρόνο στις GPUs μας. Ένα αρχείο ήχου 1 ώρας τελειώνει σε λιγότερο από 1 λεπτά; μεγαλύτερη ουρά αρχείων και να ειδοποιήσει με email όταν γίνει.

Vosk έχει 50M παραμέτρους. Μεγαλύτερα μοντέλα τείνουν να είναι πιο ακριβή αλλά πιο αργά; STT.ai φιλοξενεί Vosk σε GPU έτσι ώστε η μέτρηση παραμέτρου δεν επηρεάζει τις επιδόσεις του πελάτη-πλευρά σας.

Το Vosk δέχεται κάθε μορφή STT.ai υποστηρίζει MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, και άλλα. Έξοδος ως TXT, SRT, VTT, DOCX, JSON, ή PDF.

Ναι. Διαχωρισμός ομιλητών τρέχει παράλληλα με Vosk για κάθε μεταγραφή. Κάθε ομιλητής φέρει την ετικέτα και μπορείτε να τα μετονομάσετε στον επεξεργαστή στη συνέχεια.

Ναι. Vosk τρέχει στο διαχειριστικό περιβάλλον μας Ο ήχος επεξεργάζεται και διαγράφεται από προεπιλογή και δεν χρησιμοποιείται ποτέ για την εκπαίδευση χωρίς ρητή opt-in. Pro σχέδια προσθέτουν κρυπτογράφηση client-side για τα πρακτικά σε κατάσταση ηρεμίας.

Χρησιμοποιήστε το εργαλείο σύγκρισης-stt για να τρέξει Vosk με οποιοδήποτε άλλο υποστηριζόμενο μοντέλο για το ίδιο ακουστικό ~ θα δείτε WER, section μετρώντας, ετικέτες ηχείων, και βαθμολογία εμπιστοσύνης δίπλα-δίπλα. Η σύγκριση Vosk vs Whisper Large V3 είναι η πιο συχνά τρέχει.

Ναι. Καθορίστε το "vosk" ως την παράμετρο του μοντέλου στο τελικό σημείο /v1/trancribe. Python και Node.js SDKs περιλαμβάνουν Vosk παραδείγματα. Free API βαθμίδα περιλαμβάνει 100 λεπτά/μήνα.

Ναι. Επειδή το Vosk είναι Apache 2.0-licensed, μπορείτε να το αυτο-φιλοξενήσετε. STT.ai ανοιχτής πηγής σελίδα του αναφέρει το repo του έργου και τα βάρη. Οι περισσότερες ομάδες παραγωγής χρησιμοποιούν την φιλοξενούμενη έκδοση μας για να παραλείψετε προμήθειες GPU, μοντέλα ανταλλαγής, και ops.

Ημερολόγιο με Vosk

Σχετικά Vosk

Γλώσσες που υποστηρίζονται από Vosk

Υπόδειγμα πληροφοριών

Σχετικά Μοντέλα

Συχνές Ερωτήσεις

Τι είναι το Vosk;

Πόσο ακριβής είναι Vosk;

Είναι Vosk ελεύθερο να χρησιμοποιηθεί;

Ποια άδεια χρησιμοποιεί το Vosk;

Πόσες γλώσσες υποστηρίζουν Vosk;

Πόσο γρήγορα είναι Vosk;

Πόσο μεγάλο είναι το μοντέλο Vosk;

Ποιες μορφές ήχου μπορεί να Vosk τραβηχτεί;

Ανιχνεύει Vosk πολλά ηχεία;

Τα δεδομένα μου είναι προσωπικά όταν χρησιμοποιούν Vosk;

Πώς συγκρίνονται Vosk με άλλα μοντέλα STT;

Μπορώ να χρησιμοποιήσω Vosk μέσω του API;

Μπορώ να τρέξω Vosk στον δικό μου σέρβερ;