Transcribe with Distil-Whisper
5.8%
WER
99
Languages
48.0x
Speed
MIT
License
About Distil-Whisper
Model Info
- ProviderHugging Face
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Συχνές Ερωτήσεις
Distil-Whisper είναι ένα μοντέλο ομιλίας προς κείμενο από Hugging Face. STT.ai φιλοξενεί Distil-Whisper για την υποδομή GPU μας, ώστε να μπορείτε να το χρησιμοποιήσετε χωρίς να παρέχει το δικό σας υλικό? Ανεβάστε τον ήχο ή το βίντεο και επιλέξτε Distil-Whisper από το μοντέλο picker.
Στα πρότυπα σημεία αναφοράς, Distil-Whisper επιτυγχάνει περίπου 5.8% Word Error Rate. Ακρίβεια σε πραγματικό κόσμο εξαρτάται από την ποιότητα ήχου, την προφορά, και τη γλώσσα? για θορυβώδη ή τονισμένη ηχογραφήσεις, αναμένουν μερικές ποσοστιαίες μονάδες υψηλότερη WER.
Distil-Whisper τρέχει με STT.ai δωρεάν βαθμίδα. Κάθε επισκέπτης παίρνει 600 λεπτά / μήνα χωρίς κόστος.
Distil-Whisper κυκλοφορεί κάτω από MIT, μια ανεκτική άδεια ανοικτού κώδικα. Μπορείτε να αυτο-φιλοξενήσετε Distil-Whisper στο δικό σας υλικό ή να χρησιμοποιήσετε μας φιλοξενείται έκδοση και τα δύο είναι εμπορικά χρησιμοποιήσιμα.
Distil-Whisper υποστηρίζει 99 γλώσσες. Auto-detection επιλέγει τη σωστή γλώσσα για τους περισσότερους ήχους? μπορείτε επίσης να το καθορίσετε χειροκίνητα για ένα μικρό ανελκυστήρα ακρίβειας.
Distil-Whisper διαδικασίες ήχου σε περίπου 48.0x σε πραγματικό χρόνο στις GPUs μας. Ένα αρχείο ήχου 1 ώρας τελειώνει σε λιγότερο από 1 λεπτά; μεγαλύτερη ουρά αρχείων και να ειδοποιήσει με email όταν γίνει.
Distil-Whisper έχει 756M παραμέτρους. Μεγαλύτερα μοντέλα τείνουν να είναι πιο ακριβή αλλά πιο αργά; STT.ai φιλοξενεί Distil-Whisper σε GPU έτσι ώστε η μέτρηση παραμέτρου δεν επηρεάζει τις επιδόσεις του πελάτη-πλευρά σας.
Το Distil-Whisper δέχεται κάθε μορφή STT.ai υποστηρίζει MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, και άλλα. Έξοδος ως TXT, SRT, VTT, DOCX, JSON, ή PDF.
Ναι. Διαχωρισμός ομιλητών τρέχει παράλληλα με Distil-Whisper για κάθε μεταγραφή. Κάθε ομιλητής φέρει την ετικέτα και μπορείτε να τα μετονομάσετε στον επεξεργαστή στη συνέχεια.
Ναι. Distil-Whisper τρέχει στο διαχειριστικό περιβάλλον μας Ο ήχος επεξεργάζεται και διαγράφεται από προεπιλογή και δεν χρησιμοποιείται ποτέ για την εκπαίδευση χωρίς ρητή opt-in. Pro σχέδια προσθέτουν κρυπτογράφηση client-side για τα πρακτικά σε κατάσταση ηρεμίας.
Χρησιμοποιήστε το εργαλείο σύγκρισης-stt για να τρέξει Distil-Whisper με οποιοδήποτε άλλο υποστηριζόμενο μοντέλο για το ίδιο ακουστικό ~ θα δείτε WER, section μετρώντας, ετικέτες ηχείων, και βαθμολογία εμπιστοσύνης δίπλα-δίπλα. Η σύγκριση Distil-Whisper vs Whisper Large V3 είναι η πιο συχνά τρέχει.
Ναι. Καθορίστε το "distil-whisper" ως την παράμετρο του μοντέλου στο τελικό σημείο /v1/trancribe. Python και Node.js SDKs περιλαμβάνουν Distil-Whisper παραδείγματα. Free API βαθμίδα περιλαμβάνει 100 λεπτά/μήνα.
Ναι. Επειδή το Distil-Whisper είναι MIT-licensed, μπορείτε να το αυτο-φιλοξενήσετε. STT.ai ανοιχτής πηγής σελίδα του αναφέρει το repo του έργου και τα βάρη. Οι περισσότερες ομάδες παραγωγής χρησιμοποιούν την φιλοξενούμενη έκδοση μας για να παραλείψετε προμήθειες GPU, μοντέλα ανταλλαγής, και ops.