Αναφορά σφάλματος / αίτησης χαρακτηριστικών

Ημερολόγιο με Distil-Whisper

Name: Distil-Whisper
Author: Hugging Face

Λειτουργεί με δημόσια διαθέσιμα ήχου & βίντεο. DRM-προστατευμένο περιεχόμενο δεν υποστηρίζεται.

Αναβάθμιση για Ενισχυμένη

Ιδιωτικό χειρόγραφο

Συνομιλία με τα πρακτικά

Ξεκλείδωμα με Pro →

Αφήστε το αρχείο εδώ ή κάντε κλικ για να περιηγηθείτε

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM

Latch upload multiple files με Pro

Αναβάθμιση για Ενισχυμένη

Ιδιωτικό χειρόγραφο

Συνομιλία με τα πρακτικά

Ξεκλείδωμα με Pro →

Αναβάθμιση για Ενισχυμένη

Ο λόγος σε πραγματικό χρόνο στο κείμενο. AI auto-διορθώνει καθώς μιλάτε ~ Ακρίβεια βελτιώνεται με μεγαλύτερη ομιλία.

Δοκιμάστε το μικρόφωνο σας πρώτα

10 δωρεάν λεπτά/ημέρα 600 λεπτά δωρεάν με εγγραφή Χωρίς πιστωτική κάρτα Κρυπτογραφημένο

Εγγραφείτε δωρεάν →

5.8%

WER

Γλώσσες

48.0x

Ταχύτητα

MIT

Άδεια

Σχετικά Distil-Whisper

Distil-Whisper είναι μια αποσταγμένη έκδοση του Whisper δημιουργήθηκε από Hugging Face. Μειώνει το μέγεθος του μοντέλου κατά 49% και επιτυγχάνει 6x γρηγορότερο συμπέρασμα, διατηρώντας παράλληλα μέσα στο 1% WER του αρχικού Whisper Large V2 για τα εκτός διανομής σύνολα αξιολόγησης.

Γλώσσες που υποστηρίζονται από Distil-Whisper

Αγγλικά

Ισπανικά

Γαλλικά

Γερμανικά

Κινεζικά

Ιαπωνικά

Κορεατικά

Πορτογαλικά

Αραβικά

Χίντι

Ρωσικά

Ιταλικά

Ολλανδικά

Τουρκικά

Πολωνικά

Σουηδικά

Ινδονησιακά

Ταϊλανδικά

Βιετναμικά

Τσεχικά

Ελληνικά

Ρουμανικά

Ουγγρικά

Εβραϊκά

Δανικά

Φινλανδικά

Νορβηγικά

Ουκρανικά

Μαλαισιανά

Βεγγαλικά

Υπόδειγμα πληροφοριών

ΠρομηθευτήςHugging Face
Αρχιτεκτονική-
ΆδειαMIT
ΕνημερώθηκεMar 2026

Σχετικά Μοντέλα

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Συχνές Ερωτήσεις

Distil-Whisper είναι ένα μοντέλο ομιλίας προς κείμενο από Hugging Face. STT.ai φιλοξενεί Distil-Whisper για την υποδομή GPU μας, ώστε να μπορείτε να το χρησιμοποιήσετε χωρίς να παρέχει το δικό σας υλικό? Ανεβάστε τον ήχο ή το βίντεο και επιλέξτε Distil-Whisper από το μοντέλο picker.

Στα πρότυπα σημεία αναφοράς, Distil-Whisper επιτυγχάνει περίπου 5.8% Word Error Rate. Ακρίβεια σε πραγματικό κόσμο εξαρτάται από την ποιότητα ήχου, την προφορά, και τη γλώσσα? για θορυβώδη ή τονισμένη ηχογραφήσεις, αναμένουν μερικές ποσοστιαίες μονάδες υψηλότερη WER.

Distil-Whisper τρέχει με STT.ai δωρεάν βαθμίδα

Distil-Whisper κυκλοφορεί κάτω από MIT, μια ανεκτική άδεια ανοικτού κώδικα. Μπορείτε να αυτο-φιλοξενήσετε Distil-Whisper στο δικό σας υλικό ή να χρησιμοποιήσετε μας φιλοξενείται έκδοση και τα δύο είναι εμπορικά χρησιμοποιήσιμα.

Distil-Whisper υποστηρίζει 99 γλώσσες. Auto-detection επιλέγει τη σωστή γλώσσα για τους περισσότερους ήχους? μπορείτε επίσης να το καθορίσετε χειροκίνητα για ένα μικρό ανελκυστήρα ακρίβειας.

Distil-Whisper διαδικασίες ήχου σε περίπου 48.0x σε πραγματικό χρόνο στις GPUs μας. Ένα αρχείο ήχου 1 ώρας τελειώνει σε λιγότερο από 1 λεπτά; μεγαλύτερη ουρά αρχείων και να ειδοποιήσει με email όταν γίνει.

Distil-Whisper έχει 756M παραμέτρους. Μεγαλύτερα μοντέλα τείνουν να είναι πιο ακριβή αλλά πιο αργά; STT.ai φιλοξενεί Distil-Whisper σε GPU έτσι ώστε η μέτρηση παραμέτρου δεν επηρεάζει τις επιδόσεις του πελάτη-πλευρά σας.

Το Distil-Whisper δέχεται κάθε μορφή STT.ai υποστηρίζει MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, και άλλα. Έξοδος ως TXT, SRT, VTT, DOCX, JSON, ή PDF.

Ναι. Διαχωρισμός ομιλητών τρέχει παράλληλα με Distil-Whisper για κάθε μεταγραφή. Κάθε ομιλητής φέρει την ετικέτα και μπορείτε να τα μετονομάσετε στον επεξεργαστή στη συνέχεια.

Ναι. Distil-Whisper τρέχει στο διαχειριστικό περιβάλλον μας Ο ήχος επεξεργάζεται και διαγράφεται από προεπιλογή και δεν χρησιμοποιείται ποτέ για την εκπαίδευση χωρίς ρητή opt-in. Pro σχέδια προσθέτουν κρυπτογράφηση client-side για τα πρακτικά σε κατάσταση ηρεμίας.

Χρησιμοποιήστε το εργαλείο σύγκρισης-stt για να τρέξει Distil-Whisper με οποιοδήποτε άλλο υποστηριζόμενο μοντέλο για το ίδιο ακουστικό ~ θα δείτε WER, section μετρώντας, ετικέτες ηχείων, και βαθμολογία εμπιστοσύνης δίπλα-δίπλα. Η σύγκριση Distil-Whisper vs Whisper Large V3 είναι η πιο συχνά τρέχει.

Ναι. Καθορίστε το "distil-whisper" ως την παράμετρο του μοντέλου στο τελικό σημείο /v1/trancribe. Python και Node.js SDKs περιλαμβάνουν Distil-Whisper παραδείγματα. Free API βαθμίδα περιλαμβάνει 100 λεπτά/μήνα.

Ναι. Επειδή το Distil-Whisper είναι MIT-licensed, μπορείτε να το αυτο-φιλοξενήσετε. STT.ai ανοιχτής πηγής σελίδα του αναφέρει το repo του έργου και τα βάρη. Οι περισσότερες ομάδες παραγωγής χρησιμοποιούν την φιλοξενούμενη έκδοση μας για να παραλείψετε προμήθειες GPU, μοντέλα ανταλλαγής, και ops.

Ημερολόγιο με Distil-Whisper

Σχετικά Distil-Whisper

Γλώσσες που υποστηρίζονται από Distil-Whisper

Υπόδειγμα πληροφοριών

Σχετικά Μοντέλα

Συχνές Ερωτήσεις

Τι είναι το Distil-Whisper;

Πόσο ακριβής είναι Distil-Whisper;

Είναι Distil-Whisper ελεύθερο να χρησιμοποιηθεί;

Ποια άδεια χρησιμοποιεί το Distil-Whisper;

Πόσες γλώσσες υποστηρίζουν Distil-Whisper;

Πόσο γρήγορα είναι Distil-Whisper;

Πόσο μεγάλο είναι το μοντέλο Distil-Whisper;

Ποιες μορφές ήχου μπορεί να Distil-Whisper τραβηχτεί;

Ανιχνεύει Distil-Whisper πολλά ηχεία;

Τα δεδομένα μου είναι προσωπικά όταν χρησιμοποιούν Distil-Whisper;

Πώς συγκρίνονται Distil-Whisper με άλλα μοντέλα STT;

Μπορώ να χρησιμοποιήσω Distil-Whisper μέσω του API;

Μπορώ να τρέξω Distil-Whisper στον δικό μου σέρβερ;