Transcribe with NVIDIA Canary
3.5%
WER
4
Languages
45.0x
Speed
CC-BY-4.0
License
About NVIDIA Canary
Model Info
- ProviderNVIDIA
- Architecture-
- LicenseCC-BY-4.0
- UpdatedMar 2026
Συχνές Ερωτήσεις
NVIDIA Canary είναι ένα μοντέλο ομιλίας προς κείμενο από NVIDIA. STT.ai φιλοξενεί NVIDIA Canary για την υποδομή GPU μας, ώστε να μπορείτε να το χρησιμοποιήσετε χωρίς να παρέχει το δικό σας υλικό? Ανεβάστε τον ήχο ή το βίντεο και επιλέξτε NVIDIA Canary από το μοντέλο picker.
Στα πρότυπα σημεία αναφοράς, NVIDIA Canary επιτυγχάνει περίπου 3.5% Word Error Rate. Ακρίβεια σε πραγματικό κόσμο εξαρτάται από την ποιότητα ήχου, την προφορά, και τη γλώσσα? για θορυβώδη ή τονισμένη ηχογραφήσεις, αναμένουν μερικές ποσοστιαίες μονάδες υψηλότερη WER.
NVIDIA Canary τρέχει με STT.ai δωρεάν βαθμίδα. Κάθε επισκέπτης παίρνει 600 λεπτά / μήνα χωρίς κόστος.
NVIDIA Canary κυκλοφορεί κάτω από CC-BY-4.0, μια ανεκτική άδεια ανοικτού κώδικα. Μπορείτε να αυτο-φιλοξενήσετε NVIDIA Canary στο δικό σας υλικό ή να χρησιμοποιήσετε μας φιλοξενείται έκδοση και τα δύο είναι εμπορικά χρησιμοποιήσιμα.
NVIDIA Canary υποστηρίζει 4 γλώσσες. Auto-detection επιλέγει τη σωστή γλώσσα για τους περισσότερους ήχους? μπορείτε επίσης να το καθορίσετε χειροκίνητα για ένα μικρό ανελκυστήρα ακρίβειας.
NVIDIA Canary διαδικασίες ήχου σε περίπου 45.0x σε πραγματικό χρόνο στις GPUs μας. Ένα αρχείο ήχου 1 ώρας τελειώνει σε λιγότερο από 1 λεπτά; μεγαλύτερη ουρά αρχείων και να ειδοποιήσει με email όταν γίνει.
NVIDIA Canary έχει 1B παραμέτρους. Μεγαλύτερα μοντέλα τείνουν να είναι πιο ακριβή αλλά πιο αργά; STT.ai φιλοξενεί NVIDIA Canary σε GPU έτσι ώστε η μέτρηση παραμέτρου δεν επηρεάζει τις επιδόσεις του πελάτη-πλευρά σας.
Το NVIDIA Canary δέχεται κάθε μορφή STT.ai υποστηρίζει MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, και άλλα. Έξοδος ως TXT, SRT, VTT, DOCX, JSON, ή PDF.
Ναι. Διαχωρισμός ομιλητών τρέχει παράλληλα με NVIDIA Canary για κάθε μεταγραφή. Κάθε ομιλητής φέρει την ετικέτα και μπορείτε να τα μετονομάσετε στον επεξεργαστή στη συνέχεια.
Ναι. NVIDIA Canary τρέχει στο διαχειριστικό περιβάλλον μας Ο ήχος επεξεργάζεται και διαγράφεται από προεπιλογή και δεν χρησιμοποιείται ποτέ για την εκπαίδευση χωρίς ρητή opt-in. Pro σχέδια προσθέτουν κρυπτογράφηση client-side για τα πρακτικά σε κατάσταση ηρεμίας.
Χρησιμοποιήστε το εργαλείο σύγκρισης-stt για να τρέξει NVIDIA Canary με οποιοδήποτε άλλο υποστηριζόμενο μοντέλο για το ίδιο ακουστικό ~ θα δείτε WER, section μετρώντας, ετικέτες ηχείων, και βαθμολογία εμπιστοσύνης δίπλα-δίπλα. Η σύγκριση NVIDIA Canary vs Whisper Large V3 είναι η πιο συχνά τρέχει.
Ναι. Καθορίστε το "nvidia-canary" ως την παράμετρο του μοντέλου στο τελικό σημείο /v1/trancribe. Python και Node.js SDKs περιλαμβάνουν NVIDIA Canary παραδείγματα. Free API βαθμίδα περιλαμβάνει 100 λεπτά/μήνα.
Ναι. Επειδή το NVIDIA Canary είναι CC-BY-4.0-licensed, μπορείτε να το αυτο-φιλοξενήσετε. STT.ai ανοιχτής πηγής σελίδα του αναφέρει το repo του έργου και τα βάρη. Οι περισσότερες ομάδες παραγωγής χρησιμοποιούν την φιλοξενούμενη έκδοση μας για να παραλείψετε προμήθειες GPU, μοντέλα ανταλλαγής, και ops.