Transcribe with NVIDIA Canary

> Gumagana sa publikong magagamit na audio at video. DRM-protected na nilalaman ay hindi suportado.

> Upgrade para sa Pinabuting
Private transcript
> Chat sa transcript
> I-unlock sa Pro →
> Drop file dito o mag-click upang mag-browse
Ang mga format ng video na suportado ay MP4, MOV, MKV, AVI, FLV, at iba pa.
> Upgrade para sa Pinabuting
Private transcript
> Chat sa transcript
> I-unlock sa Pro →
> Upgrade para sa Pinabuting
Pag-record: 0:00
Real-time Ang Ōmi (おみ, lit.
Pinahusay > Wika (tumpak)
> Mga link ng publiko: 24h, teksto lamang · Mag-sign up tl> para sa 7d + audio · Pro para sa mga pribadong link

> Real-time na pagsasalita sa teksto. Nag-a-auto-correct ang AI habang nagsasalita ka — pinabuting katumpakan sa mas mahabang pagsasalita.

> Subukan ang iyong microphone muna
❤️ Ibig STT.ai? Sabihin sa iyong mga kaibigan!
> Ginamit mo na ang iyong libreng transcriptions

> Mag-sign up para sa libreng upang makakuha ng 600 minuto / buwan, o mag-upgrade para sa walang limitasyong mga transcription.

> 10 libreng minuto/araw > 600 minuto libreng may pag-signup Walang credit card Naka-encrypt
Mag-sign up para sa libreng →
3.5%
WER
4
Languages
45.0x
Speed
CC-BY-4.0
License

About NVIDIA Canary

Languages Supported by NVIDIA Canary

Mga Madalas Itanong

STT.ai hosts NVIDIA Canary sa aming GPU imprastraktura kaya maaari mong gamitin ito nang walang pagbibigay ng iyong sariling hardware — mag-upload ng audio o video at pumili NVIDIA Canary mula sa modelo picker.

> Sa mga pamantayan benchmarks, NVIDIA Canary ay nakamit sa paligid ng 3.5% Word Error Rate. Real-world katumpakan ay depende sa kalidad ng audio, accent, at wika; para sa noisy o accented recordings, asahan ng ilang porsyento puntos mas mataas na WER.

NVIDIA Canary ay tumatakbo sa STT.ai ng libreng antas - bawat bisita ay makakakuha ng 600 minuto / buwan nang walang gastos. Paid plano magdagdag ng mas mahabang bawat-file na limitasyon, pribadong transcripts, at prayoridad queueing.

NVIDIA Canary ay inilabas sa ilalim ng CC-BY-4.0, isang permissive open-source na lisensya. Maaari mong self-host NVIDIA Canary sa iyong sariling hardware o gamitin ang aming hosted na bersyon - parehong commercially magagamit.

> NVIDIA Canary sumusuporta sa 4 wika. Auto-detection picks ang tamang wika para sa karamihan ng audio; maaari mo ring tukuyin ito nang manu-mano para sa isang maliit na katumpakan lift.

> NVIDIA Canary proseso audio sa tungkol sa 45.0x real-time sa aming GPUs. Ang isang 1-oras na audio file ay nagtatapos sa ilalim ng 1 minuto; mas mahabang file queue at mag-notify sa pamamagitan ng email kapag tapos na.

NVIDIA Canary ay may 1B parameter. Mas malaki modelo ay may posibilidad na maging mas tumpak ngunit mas mabagal; STT.ai host NVIDIA Canary sa GPU kaya ang bilang ng parameter ay hindi nakakaapekto sa iyong client-side pagganap.

Ang mga format na suportado ng STT.ai ay MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, at iba pa. Ang output ay TXT, SRT, VTT, DOCX, JSON, o PDF.

> Oo. Speaker diarization tumatakbo kasama NVIDIA Canary para sa bawat transcription — bawat speaker ay may label at maaari mong palitan ang pangalan ng mga ito sa editor pagkatapos.

NVIDIA Canary tumatakbo sa aming pinamamahalaang kapaligiran – audio ay pinoproseso at tinanggal sa pamamagitan ng default at hindi kailanman ginagamit para sa pagsasanay nang walang malinaw na opt-in. Pro plano magdagdag ng client-side encryption para sa transcripts sa pahinga.

> Gamitin ang i-compare-stt tool upang patakbuhin ang NVIDIA Canary laban sa anumang iba pang mga suportadong modelo sa parehong audio - makikita mo WER, segment count, speaker label, at kumpiyansa score side-by-side. Ang NVIDIA Canary vs Whisper Large V3 paghahambing ay ang pinaka-karaniwang tumakbo.

> Oo. tukuyin ang "nvidia-canary" bilang ang modelo parameter sa / v1 / transcribe endpoint. Python at Node.js SDKs isama NVIDIA Canary halimbawa. Libreng API tier kasama ang 100 minuto / buwan.

> Oo. Dahil NVIDIA Canary ay CC-BY-4.0-licensed, maaari mong self-host ito. STT.ai's open-source page listahan ng proyekto repo at timbang. Karamihan sa mga koponan ng produksyon gamitin ang aming hosted na bersyon upang i-skip GPU procurement, modelo swaps, at ops.