Transcribe with Distil-Whisper

Λειτουργεί με δημόσια διαθέσιμα ήχου & βίντεο. DRM-προστατευμένο περιεχόμενο δεν υποστηρίζεται.

Αναβάθμιση για Ενισχυμένη
Private transcript
Συνομιλία με τα πρακτικά
Ξεκλείδωμα με Pro →
Αφήστε το αρχείο εδώ ή κάντε κλικ για να περιηγηθείτε
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM
Αναβάθμιση για Ενισχυμένη
Private transcript
Συνομιλία με τα πρακτικά
Ξεκλείδωμα με Pro →
Αναβάθμιση για Ενισχυμένη
Καταγραφή: 0:00
Σε πραγματικό χρόνο Βοσκ (ακαριαία)
Ενισχυμένη Ψίθυρος (ακριβής)
Δημόσιοι σύνδεσμοι: 24 ώρες, κείμενο μόνο · Εγγραφείτε για 7δ + ήχος · Pro για ιδιωτικούς συνδέσμους

Ο λόγος σε πραγματικό χρόνο στο κείμενο. AI auto-διορθώνει καθώς μιλάτε ~ Ακρίβεια βελτιώνεται με μεγαλύτερη ομιλία.

Δοκιμάστε το μικρόφωνο σας πρώτα
❤️ Αγάπη STT.ai; Πες το στους φίλους σου!
Χρησιμοποίησες τις δωρεάν μεταγραφές σου.

Εγγραφείτε δωρεάν για να πάρετε 600 λεπτά/μήνα, ή αναβάθμιση για απεριόριστες μεταγραφές.

10 δωρεάν λεπτά/ημέρα 600 λεπτά δωρεάν με εγγραφή Χωρίς πιστωτική κάρτα Κρυπτογραφημένο
Εγγραφείτε δωρεάν →
5.8%
WER
99
Languages
48.0x
Speed
MIT
License

About Distil-Whisper

Συχνές Ερωτήσεις

Distil-Whisper είναι ένα μοντέλο ομιλίας προς κείμενο από Hugging Face. STT.ai φιλοξενεί Distil-Whisper για την υποδομή GPU μας, ώστε να μπορείτε να το χρησιμοποιήσετε χωρίς να παρέχει το δικό σας υλικό? Ανεβάστε τον ήχο ή το βίντεο και επιλέξτε Distil-Whisper από το μοντέλο picker.

Στα πρότυπα σημεία αναφοράς, Distil-Whisper επιτυγχάνει περίπου 5.8% Word Error Rate. Ακρίβεια σε πραγματικό κόσμο εξαρτάται από την ποιότητα ήχου, την προφορά, και τη γλώσσα? για θορυβώδη ή τονισμένη ηχογραφήσεις, αναμένουν μερικές ποσοστιαίες μονάδες υψηλότερη WER.

Distil-Whisper τρέχει με STT.ai δωρεάν βαθμίδα. Κάθε επισκέπτης παίρνει 600 λεπτά / μήνα χωρίς κόστος.

Distil-Whisper κυκλοφορεί κάτω από MIT, μια ανεκτική άδεια ανοικτού κώδικα. Μπορείτε να αυτο-φιλοξενήσετε Distil-Whisper στο δικό σας υλικό ή να χρησιμοποιήσετε μας φιλοξενείται έκδοση και τα δύο είναι εμπορικά χρησιμοποιήσιμα.

Distil-Whisper υποστηρίζει 99 γλώσσες. Auto-detection επιλέγει τη σωστή γλώσσα για τους περισσότερους ήχους? μπορείτε επίσης να το καθορίσετε χειροκίνητα για ένα μικρό ανελκυστήρα ακρίβειας.

Distil-Whisper διαδικασίες ήχου σε περίπου 48.0x σε πραγματικό χρόνο στις GPUs μας. Ένα αρχείο ήχου 1 ώρας τελειώνει σε λιγότερο από 1 λεπτά; μεγαλύτερη ουρά αρχείων και να ειδοποιήσει με email όταν γίνει.

Distil-Whisper έχει 756M παραμέτρους. Μεγαλύτερα μοντέλα τείνουν να είναι πιο ακριβή αλλά πιο αργά; STT.ai φιλοξενεί Distil-Whisper σε GPU έτσι ώστε η μέτρηση παραμέτρου δεν επηρεάζει τις επιδόσεις του πελάτη-πλευρά σας.

Το Distil-Whisper δέχεται κάθε μορφή STT.ai υποστηρίζει MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, και άλλα. Έξοδος ως TXT, SRT, VTT, DOCX, JSON, ή PDF.

Ναι. Διαχωρισμός ομιλητών τρέχει παράλληλα με Distil-Whisper για κάθε μεταγραφή. Κάθε ομιλητής φέρει την ετικέτα και μπορείτε να τα μετονομάσετε στον επεξεργαστή στη συνέχεια.

Ναι. Distil-Whisper τρέχει στο διαχειριστικό περιβάλλον μας Ο ήχος επεξεργάζεται και διαγράφεται από προεπιλογή και δεν χρησιμοποιείται ποτέ για την εκπαίδευση χωρίς ρητή opt-in. Pro σχέδια προσθέτουν κρυπτογράφηση client-side για τα πρακτικά σε κατάσταση ηρεμίας.

Χρησιμοποιήστε το εργαλείο σύγκρισης-stt για να τρέξει Distil-Whisper με οποιοδήποτε άλλο υποστηριζόμενο μοντέλο για το ίδιο ακουστικό ~ θα δείτε WER, section μετρώντας, ετικέτες ηχείων, και βαθμολογία εμπιστοσύνης δίπλα-δίπλα. Η σύγκριση Distil-Whisper vs Whisper Large V3 είναι η πιο συχνά τρέχει.

Ναι. Καθορίστε το "distil-whisper" ως την παράμετρο του μοντέλου στο τελικό σημείο /v1/trancribe. Python και Node.js SDKs περιλαμβάνουν Distil-Whisper παραδείγματα. Free API βαθμίδα περιλαμβάνει 100 λεπτά/μήνα.

Ναι. Επειδή το Distil-Whisper είναι MIT-licensed, μπορείτε να το αυτο-φιλοξενήσετε. STT.ai ανοιχτής πηγής σελίδα του αναφέρει το repo του έργου και τα βάρη. Οι περισσότερες ομάδες παραγωγής χρησιμοποιούν την φιλοξενούμενη έκδοση μας για να παραλείψετε προμήθειες GPU, μοντέλα ανταλλαγής, και ops.