Transcribe with NVIDIA Canary
3.5%
WER
4
Languages
45.0x
Speed
CC-BY-4.0
License
About NVIDIA Canary
Model Info
- ProviderNVIDIA
- Architecture-
- LicenseCC-BY-4.0
- UpdatedMar 2026
यदा-कदा सोध्यमानानि प्रश्नानि
NVIDIA Canary is a speech-to-text model by NVIDIA. STT.ai hosts NVIDIA Canary on our GPU infrastructure so you can use it without provisioning your own hardware — upload audio or video and pick NVIDIA Canary from the model picker.
NVIDIA Canary-या 3.5% शब्द-त्रुटि-दरः अस्ति। वास्तविक-विश्वे त्रुटि-निवारणं ध्वनि-गुणवत्ते, उच्चारणे, भाषायां च निर्भरम् अस्ति। शोरमय-या उच्चारणयुक्त-रेकॉर्डिङ्ग-कार्ये WER-गुणवत्तेः प्रति प्रतिशतं 100% अधिकं भविष्यति।
NVIDIA Canary STT.ai's free tier पर्यन्तं चलति - प्रत्येकं आगत्य 600 मिनटाः/मासः विनामूल्ये प्राप्तवन्तः। शुल्कं दत्तानि योजनानि अधिकं प्रति-फाइलम् सीमां, निजीं वार्तालापं, तथा प्राथमिकतां सूचयितुं प्रदत्तानि सन्ति।
NVIDIA Canary CC-BY-4.0, एकः अनुकूलः ओपन-सोर्स-लिसिन् इत्यनेन जारीः अस्ति । NVIDIA Canary तम् अहं स्व-होस्टं कृत्वा तम् अहं ह्यर्डवेर् परं स्थापयितुं शक्नुमि, अथवा तम् अहं ह्यर्डवेर् परं स्थापयितुं शक्नुमि — एतयोः द्वयोः व्यापारिकः उपयोगः क्रियते ।
NVIDIA Canary 4 भाषान् समर्थयति । स्वचालित-दृष्टिः अधिकतरेभ्यः ऑडियोभ्यः उचितं भाषां चेत् । तव येन प्रकारेण स्वचालिततया चेत् तात्पुरं अधिकं स्थिरं भाषां चेत् ।
NVIDIA Canary processes audio at about 45.0x real-time on our GPUs. A 1-hour audio file finishes in under 1 minutes; longer files queue and notify by email when done.
NVIDIA Canary स्य 1B परमाणुः सन्ति । बृहत् मॉडेलः अधिकं सटीकं तथापि धीमं भवति । STT.ai NVIDIA Canary म् GPU परम् स्थापयति, अतः परमाणुसंख्या स्य क्लायन्ट-साइड परफॉर्मेन्सिम् न प्रभाविता भवति ।
NVIDIA Canary स्वीकरोति STT.ai समर्थितेषु सर्वेषु प्रारूपेषु — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and others. Output as TXT, SRT, VTT, DOCX, JSON, or PDF.
Yes. Speaker diarization runs alongside NVIDIA Canary for every transcription — each speaker is labeled and you can rename them in the editor afterwards.
NVIDIA Canary सञ्चालितेषु वातावरणेषु सञ्चालितम् - अडियो प्रक्रियया प्रवर्त्यते, डिफॉल्टेन लोप्यते, तथा पर्यवेक्षणार्थं स्वीक्रियते। प्रो प्लान्स् क्रीडायां न सञ्चालितानां वार्तानां क्लायन्ट-साइड एन्क्रिप्शनम् आगच्छति।
NVIDIA Canary सह अन्ये समर्थिताः मॉडेलः समाने ऑडियो पर्यन्तं चलयितुं compare-stt यन्त्रं सञ्चालितं भवति - WER, segment count, speaker labels, and confidence scores side-by-side दृश्यन्ते । NVIDIA Canary वि Whisper Large V3 सह तुलना सर्वाधिकं प्रचलति ।
nvidia-canary इति मॉडेल-परिमाणम् /v1/transcribe-एण्डपॉइंट् पर्यन्तं निर्दिष्टं भवति। Python तथा Node.js SDKs NVIDIA Canary उदाहरणानि समाविष्टानि सन्ति। मुफ्त-API-स्तरे 100 मिनटाः/मासः समाविष्टाः सन्ति।
STT.ai's open-source page lists the project repo and weights. Most production teams use our hosted version to skip GPU procurement, model swaps, and ops. STT.ai's open-source page lists the project repo and weights.