Αναφορά σφάλματος / αίτησης χαρακτηριστικών

Ημερολόγιο με SenseVoice

Name: SenseVoice
Author: FunAudioLLM

Λειτουργεί με δημόσια διαθέσιμα ήχου & βίντεο. DRM-προστατευμένο περιεχόμενο δεν υποστηρίζεται.

Αναβάθμιση για Ενισχυμένη

Ιδιωτικό χειρόγραφο

Συνομιλία με τα πρακτικά

Ξεκλείδωμα με Pro →

Αφήστε το αρχείο εδώ ή κάντε κλικ για να περιηγηθείτε

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM

Latch upload multiple files με Pro

Αναβάθμιση για Ενισχυμένη

Ιδιωτικό χειρόγραφο

Συνομιλία με τα πρακτικά

Ξεκλείδωμα με Pro →

Αναβάθμιση για Ενισχυμένη

Ο λόγος σε πραγματικό χρόνο στο κείμενο. AI auto-διορθώνει καθώς μιλάτε ~ Ακρίβεια βελτιώνεται με μεγαλύτερη ομιλία.

Δοκιμάστε το μικρόφωνο σας πρώτα

10 δωρεάν λεπτά/ημέρα 600 λεπτά δωρεάν με εγγραφή Χωρίς πιστωτική κάρτα Κρυπτογραφημένο

Εγγραφείτε δωρεάν →

5.5%

WER

Γλώσσες

50.0x

Ταχύτητα

MIT

Άδεια

Σχετικά SenseVoice

Η SenseVoice είναι ένα μοντέλο βάσης ομιλίας από το FunAudioLLM που πηγαίνει πέρα από τη μεταγραφή. Υποστηρίζει 50+ γλώσσες και περιλαμβάνει δυνατότητες για αναγνώριση συναισθημάτων, ανίχνευση γεγονότων ήχου, και αντιστροφή ομαλοποίηση κειμένου σε ένα ενιαίο μοντέλο.

Γλώσσες που υποστηρίζονται από SenseVoice

Αγγλικά

Ισπανικά

Γαλλικά

Γερμανικά

Κινεζικά

Ιαπωνικά

Κορεατικά

Πορτογαλικά

Αραβικά

Χίντι

Ρωσικά

Ιταλικά

Ολλανδικά

Τουρκικά

Πολωνικά

Σουηδικά

Ινδονησιακά

Ταϊλανδικά

Βιετναμικά

Τσεχικά

Ελληνικά

Ρουμανικά

Ουγγρικά

Εβραϊκά

Δανικά

Φινλανδικά

Νορβηγικά

Ουκρανικά

Μαλαισιανά

Βεγγαλικά

Υπόδειγμα πληροφοριών

ΠρομηθευτήςFunAudioLLM
Αρχιτεκτονική-
ΆδειαMIT
ΕνημερώθηκεMar 2026

Σχετικά Μοντέλα

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Συχνές Ερωτήσεις

SenseVoice είναι ένα μοντέλο ομιλίας προς κείμενο από FunAudioLLM. STT.ai φιλοξενεί SenseVoice για την υποδομή GPU μας, ώστε να μπορείτε να το χρησιμοποιήσετε χωρίς να παρέχει το δικό σας υλικό? Ανεβάστε τον ήχο ή το βίντεο και επιλέξτε SenseVoice από το μοντέλο picker.

Στα πρότυπα σημεία αναφοράς, SenseVoice επιτυγχάνει περίπου 5.5% Word Error Rate. Ακρίβεια σε πραγματικό κόσμο εξαρτάται από την ποιότητα ήχου, την προφορά, και τη γλώσσα? για θορυβώδη ή τονισμένη ηχογραφήσεις, αναμένουν μερικές ποσοστιαίες μονάδες υψηλότερη WER.

SenseVoice τρέχει με STT.ai δωρεάν βαθμίδα

SenseVoice κυκλοφορεί κάτω από MIT, μια ανεκτική άδεια ανοικτού κώδικα. Μπορείτε να αυτο-φιλοξενήσετε SenseVoice στο δικό σας υλικό ή να χρησιμοποιήσετε μας φιλοξενείται έκδοση και τα δύο είναι εμπορικά χρησιμοποιήσιμα.

SenseVoice υποστηρίζει 50 γλώσσες. Auto-detection επιλέγει τη σωστή γλώσσα για τους περισσότερους ήχους? μπορείτε επίσης να το καθορίσετε χειροκίνητα για ένα μικρό ανελκυστήρα ακρίβειας.

SenseVoice διαδικασίες ήχου σε περίπου 50.0x σε πραγματικό χρόνο στις GPUs μας. Ένα αρχείο ήχου 1 ώρας τελειώνει σε λιγότερο από 1 λεπτά; μεγαλύτερη ουρά αρχείων και να ειδοποιήσει με email όταν γίνει.

SenseVoice έχει 234M παραμέτρους. Μεγαλύτερα μοντέλα τείνουν να είναι πιο ακριβή αλλά πιο αργά; STT.ai φιλοξενεί SenseVoice σε GPU έτσι ώστε η μέτρηση παραμέτρου δεν επηρεάζει τις επιδόσεις του πελάτη-πλευρά σας.

Το SenseVoice δέχεται κάθε μορφή STT.ai υποστηρίζει MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, και άλλα. Έξοδος ως TXT, SRT, VTT, DOCX, JSON, ή PDF.

Ναι. Διαχωρισμός ομιλητών τρέχει παράλληλα με SenseVoice για κάθε μεταγραφή. Κάθε ομιλητής φέρει την ετικέτα και μπορείτε να τα μετονομάσετε στον επεξεργαστή στη συνέχεια.

Ναι. SenseVoice τρέχει στο διαχειριστικό περιβάλλον μας Ο ήχος επεξεργάζεται και διαγράφεται από προεπιλογή και δεν χρησιμοποιείται ποτέ για την εκπαίδευση χωρίς ρητή opt-in. Pro σχέδια προσθέτουν κρυπτογράφηση client-side για τα πρακτικά σε κατάσταση ηρεμίας.

Χρησιμοποιήστε το εργαλείο σύγκρισης-stt για να τρέξει SenseVoice με οποιοδήποτε άλλο υποστηριζόμενο μοντέλο για το ίδιο ακουστικό ~ θα δείτε WER, section μετρώντας, ετικέτες ηχείων, και βαθμολογία εμπιστοσύνης δίπλα-δίπλα. Η σύγκριση SenseVoice vs Whisper Large V3 είναι η πιο συχνά τρέχει.

Ναι. Καθορίστε το "sensevoice" ως την παράμετρο του μοντέλου στο τελικό σημείο /v1/trancribe. Python και Node.js SDKs περιλαμβάνουν SenseVoice παραδείγματα. Free API βαθμίδα περιλαμβάνει 100 λεπτά/μήνα.

Ναι. Επειδή το SenseVoice είναι MIT-licensed, μπορείτε να το αυτο-φιλοξενήσετε. STT.ai ανοιχτής πηγής σελίδα του αναφέρει το repo του έργου και τα βάρη. Οι περισσότερες ομάδες παραγωγής χρησιμοποιούν την φιλοξενούμενη έκδοση μας για να παραλείψετε προμήθειες GPU, μοντέλα ανταλλαγής, και ops.

Ημερολόγιο με SenseVoice

Σχετικά SenseVoice

Γλώσσες που υποστηρίζονται από SenseVoice

Υπόδειγμα πληροφοριών

Σχετικά Μοντέλα

Συχνές Ερωτήσεις

Τι είναι το SenseVoice;

Πόσο ακριβής είναι SenseVoice;

Είναι SenseVoice ελεύθερο να χρησιμοποιηθεί;

Ποια άδεια χρησιμοποιεί το SenseVoice;

Πόσες γλώσσες υποστηρίζουν SenseVoice;

Πόσο γρήγορα είναι SenseVoice;

Πόσο μεγάλο είναι το μοντέλο SenseVoice;

Ποιες μορφές ήχου μπορεί να SenseVoice τραβηχτεί;

Ανιχνεύει SenseVoice πολλά ηχεία;

Τα δεδομένα μου είναι προσωπικά όταν χρησιμοποιούν SenseVoice;

Πώς συγκρίνονται SenseVoice με άλλα μοντέλα STT;

Μπορώ να χρησιμοποιήσω SenseVoice μέσω του API;

Μπορώ να τρέξω SenseVoice στον δικό μου σέρβερ;