Lapor Pepijat / Permintaan Ciri

_Trenskripsikan dengan NVIDIA Canary

Name: NVIDIA Canary
Author: NVIDIA

Berfungsi dengan audio & video yang tersedia untuk umum. Kandungan yang dilindungi DRM tidak disokong.

Naik taraf untuk Dipertingkatkan

Transkripsi Peribadi

Berbual dengan transkripsi

Buka dengan Pro →

Letakkan fail di sini atau klik untuk layari

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — sehingga 2GB

Muat naik fail berbilang secara berkelompok dengan Pro

Naik taraf untuk Dipertingkatkan

Transkripsi Peribadi

Berbual dengan transkripsi

Buka dengan Pro →

Naik taraf untuk Dipertingkatkan

Percakapan masa nyata ke teks. AI auto-betulkan bila anda bercakap — ketepatan bertambah dengan percakapan yang lebih panjang.

Uji mikrofon anda dahulu

10 minit percuma/hari 600 min percuma dengan mendaftar Tiada kad kredit Disulitkan

Daftar masuk percuma →

3.5%

WER

Bahasa

45.0x

Kelajuan

CC-BY-4.0

Lesen

Tentang NVIDIA Canary

NVIDIA Canary adalah model parameter 1B yang hebat pada transkripsi Bahasa Inggeris, Jerman, Perancis, dan Sepanyol. Dibina pada kerangka NeMo, ia menggunakan pengekod FastConformer dengan pengekod-dekod transformator dan menyokong pengesanan bahasa dan terjemahan automatik.

Bahasa yang disokong oleh NVIDIA Canary

Inggeris

Sepanyol

Perancis

Jerman

Maklumat Model

PenyediaNVIDIA
Arkitektur-
LesenCC-BY-4.0
DikemaskiniMar 2026

Model berkaitan

3.2% WER

4.2% WER

5.1% WER

7.8% WER

3.0% WER

Soalan Lazim

NVIDIA Canary adalah model pertuturan-ke-teks oleh NVIDIA. STT.ai memuatkan NVIDIA Canary pada infrastruktur GPU kami supaya anda boleh menggunakannya tanpa menyediakan perkakasan anda sendiri — muat naik audio atau video dan pilih NVIDIA Canary dari pemilih model.

Pada piawaian piawai, NVIDIA Canary mencapai kira-kira 3.5% Kadar Ralat Perkataan. Ketepatan dunia nyata bergantung pada kualiti audio, loghat, dan bahasa; untuk rakaman bising atau loghat, harapkan beberapa peratusan WER yang lebih tinggi.

NVIDIA Canary berjalan pada aras percuma STT.ai — setiap pengunjung mendapat 600 minit untuk bermula tanpa kos. Rancangan berbayar menambah had per fail yang lebih panjang, transkripsi peribadi, dan baris gilir keutamaan.

NVIDIA Canary dikeluarkan di bawah lesen sumber terbuka CC-BY-4.0. Anda boleh memuat turun NVIDIA Canary pada perkakasan anda sendiri atau menggunakan versi kami yang dimuat turun — kedua-duanya boleh digunakan secara komersial.

NVIDIA Canary menyokong 4 bahasa. Auto-kesan memilih bahasa yang betul untuk kebanyakan audio; anda juga boleh nyatakannya secara manual untuk ketelusan yang lebih baik.

NVIDIA Canary memproses audio pada kira-kira 45.0x masa nyata pada GPU kami. Fail audio 1 jam selesai dalam kurang daripada 1 minit; fail yang lebih panjang berijil dan maklumkan melalui emel bila selesai.

NVIDIA Canary mempunyai parameter 1B. Model yang lebih besar cenderung lebih tepat tetapi lebih perlahan; STT.ai memuatkan NVIDIA Canary pada GPU jadi kiraan parameter tidak mempengaruhi prestasi sisi klien anda.

NVIDIA Canary menerima setiap format yang disokong STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, dan lain-lain. Output sebagai TXT, SRT, VTT, DOCX, JSON, atau PDF.

Ya. Diarisasi pembicara berjalan bersama NVIDIA Canary untuk setiap transkripsi — setiap pembicara dilabel dan anda boleh menamakan semula mereka dalam editor selepas itu.

Ya. NVIDIA Canary berjalan dalam persekitaran yang dikendalikan kami — audio diproses dan dipadam secara lalai dan tidak pernah digunakan untuk latihan tanpa opt-in yang jelas. Rancangan Pro menambah penyulitan sisi klien untuk transkripsi ketika rehat.

Gunakan alat compare-stt untuk jalankan NVIDIA Canary terhadap model yang disokong lain pada audio yang sama — anda akan lihat WER, kiraan segmen, label pengeras, dan skor keyakinan berdampingan. Perbandingan NVIDIA Canary vs Whisper Large V3 adalah yang paling biasa dijalankan.

Ya. Nyatakan "nvidia-canary" sebagai parameter model pada titik akhir /v1/transcribe. Python dan Node.js SDKs termasuk contoh NVIDIA Canary. Tahap API percuma termasuk 100 minit/bulan.

Ya. Kerana NVIDIA Canary adalah CC-BY-4.0-licensed, anda boleh self-host ia. STT.ai's open-source page lists the project repo and weights. Kebanyakan pasukan produksi menggunakan versi kami yang dihost untuk melepasi pembelian GPU, pertukaran model, dan ops.

_Trenskripsikan dengan NVIDIA Canary

Tentang NVIDIA Canary

Bahasa yang disokong oleh NVIDIA Canary

Maklumat Model

Model berkaitan

Soalan Lazim

Apa itu NVIDIA Canary?

Berapa tepatnya NVIDIA Canary?

Adakah NVIDIA Canary percuma untuk digunakan?

Lesen apa yang NVIDIA Canary gunakan?

Berapa banyak bahasa yang disokong NVIDIA Canary?

Seberapa cepat NVIDIA Canary?

Berapa besar model NVIDIA Canary?

Format audio apa yang boleh NVIDIA Canary transkripsi?

Adakah NVIDIA Canary mengesan beberapa pembesar suara?

Adakah data saya peribadi apabila menggunakan NVIDIA Canary?

Bagaimana NVIDIA Canary dibandingkan dengan model STT lain?

Bolehkah saya menggunakan NVIDIA Canary melalui API?

Bolehkah saya menjalankan NVIDIA Canary pada pelayan saya sendiri?