Transcribe with NVIDIA Canary

Àwọn iṣẹ́ láti mú àwọn àwòrán àti àwòrán tí a yàn fún gbogbo eniyan. Àwọn àwọn ìròyìn tí a dáwọ́ láti lo DRM kò fọwọ́sì.

Àwọn ìṣàfihàn fún àwọn ìṣàfihàn
Private transcript
Fi àkọlé pamọ́
Ṣí àwọn àwọn àgbéwọlé →
Tí fáìlì náà síbẹ̀ tàbí tẹ̀ láti ṣàfihàn
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — to 2GB
Fi àwọn fáìlì mìíràn pamọ́ Àwọn àwọn àwọn àwọn àwọn
Àwọn ìṣàfihàn fún àwọn ìṣàfihàn
Private transcript
Fi àkọlé pamọ́
Ṣí àwọn àwọn àgbéwọlé →
Àwọn ìṣàfihàn fún àwọn ìṣàfihàn
Àwọn àkọlé 0:00
Àwọn ààyè-iṣẹ́ Ìgbà ìtàn
Tí a fi pamọ́ Ìjánú (ìṣàfilọ́lẹ̀)
Àwọn líǹkì ìjánu-ìjánu: 24h, àkọlé nikan · Ṣẹ̀dà fun 7d + orin · Àwọn Àwọn Àwọn fun àwọn líǹkì àìdáràn

Àwọn àkọlé àìpẹ́ láti inú àkọlé. AI kọ̀ọ̀kan-ìṣàmúlò-ètò bí a tí n sọ̀rọ̀ - ìṣàmúlò-ètò náà tí a bá kọ̀ọ̀kan àwọn àkọlé náà.

Àwọn àwọn àmì-ìwé
❤️ O fẹ́ STT.ai? Fì sọ̀kalẹ̀ fún àwọn ọrẹ̀ rẹ̀!
O ti lo àwọn ìṣàfarawé àwọn àkọsílẹ̀ ọ̀fẹ́ rẹ̀

Ṣàfihàn fun ọ̀fẹ̀ láti gba àwọn àkókò 600/oṣù, tàbí ìṣàfihàn fún àwọn ìṣàfihàn tí kò ní ìdára.

10 free min/day 600 min ọfẹ pẹlu iforukọsilẹ Kò ní kaadí ẹ̀yàn Àwọn àmì-ìwé
Ṣẹ̀dà nípa ọ̀fẹ̀ →
3.5%
WER
4
Languages
45.0x
Speed
CC-BY-4.0
License

About NVIDIA Canary

Languages Supported by NVIDIA Canary

Àwọn Àtòjọ-ẹ̀yàn

NVIDIA Canary ní móòdù ìṣàfihàn-si-àkọ́kọ́ láti NVIDIA. STT.ai ní àwọn awáròyìn NVIDIA Canary nípa àgbègbè GPU wà láti jẹ́ pé o lè lò láti fi àwọn àwọn ìṣàfihàn rẹ̀ pamọ́ - fi àwòrán àti àwòrán pamọ́ sínú àwọn awáròyìn NVIDIA Canary láti inú àwọn àwọn awáròyìn móòdù.

On standard benchmarks, NVIDIA Canary achieves around 3.5% Word Error Rate. Real-world accuracy depends on audio quality, accent, and language; for noisy or accented recordings, expect a few percentage points higher WER.

NVIDIA Canary nlọ lori STT.ai ti o ni ọfẹ — gbogbo awọn alejo gba iṣẹju 600/oṣu kan laisi idiyele. Awọn iṣẹju-aaya ti a sanwo ṣafikun awọn ibiti o ju-faili, awọn atẹwe ti ara ẹni, ati awọn atẹwe ti o ni ifẹ.

NVIDIA Canary tí a fi pamọ́ láti inú CC-BY-4.0, ìlàyè ìṣàfilọ́lẹ̀-ìṣílọ́lẹ̀. O lè fi NVIDIA Canary pamọ́ sípàrà rẹ̀ láti lò nínú àwọn ìṣàfilọ́lẹ̀ wà - gbogbo wọn ní a lè lò nínú iṣẹ́.

NVIDIA Canary ǹfà àwọn ìtàn 4. Àwọn ìṣàfihàn-ìdáràn àwọn ìtàn tí a fẹ́ fún àwọn ìṣàfihàn àwọn ìranlọwọ; o lè sọ̀rọ̀ nípa ìrànwọ́ fún ìṣàfihàn àwọn ìṣàfihàn àwọn ìṣàfihàn.

NVIDIA Canary processes audio at about 45.0x real-time on our GPUs. A 1-hour audio file finishes in under 1 minutes; longer files queue and notify by email when done.

NVIDIA Canary has 1B parameters. Larger models tend to be more accurate but slower; STT.ai hosts NVIDIA Canary on GPU so the parameter count doesn't affect your client-side performance.

NVIDIA Canary gba gbogbo àwọn ìrísí-lẹ́tà tí STT.ai ǹfàyè — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, àti àwọn mìíràn. Àwọn ìṣàfilọ́lẹ̀ bí TXT, SRT, VTT, DOCX, JSON, tàbí PDF.

Ya. Ìṣàfilọ́lẹ̀ àwọn àkọlé àwọn àkọlé náà tí wọ́n lọ́wọ́lọ́wọ́ NVIDIA Canary fún ìṣàfilọ́lẹ̀ gbogbó - àwọn àkọlé àwòrán ní pàtó àwọn àkọlé àwòrán náà nínú àwọn àwọn àkọlé àwòrán.

Yes. NVIDIA Canary runs in our managed environment — audio is processed and deleted by default and never used for training without explicit opt-in. Pro plans add client-side encryption for transcripts at rest.

Use the compare-stt tool to run NVIDIA Canary against any other supported model on the same audio — you'll see WER, segment count, speaker labels, and confidence scores side-by-side. The NVIDIA Canary vs Whisper Large V3 comparison is the most commonly run.

Ya. Ṣàfihàn "nvidia-canary" bí àwọn ààtò ìṣàmúlò-ètò módè́èlì lórí àwọn ààtò ìparí iṣẹ́ /v1/transscribe. Python àti Node.js SDKs ní àwọn ààtò ìṣàmúlò-ètò NVIDIA Canary. Àwọn ààtò API àìfẹ́ ní àwọn ààtò 100 àwọn àkókò/óṣù.

Yes. Because NVIDIA Canary is CC-BY-4.0-licensed, you can self-host it. STT.ai's open-source page lists the project repo and weights. Most production teams use our hosted version to skip GPU procurement, model swaps, and ops.