Transcribe with NVIDIA Canary
3.5%
WER
4
Languages
45.0x
Speed
CC-BY-4.0
License
About NVIDIA Canary
Model Info
- ProviderNVIDIA
- Architecture-
- LicenseCC-BY-4.0
- UpdatedMar 2026
Často kladené otázky
NVIDIA Canary je ukázkový model od NVIDIA. STT.ai hostů NVIDIA Canary na naší GPU infrastruktuře, takže ji můžete použít bez poskytnutí vlastního hardwaru a nahrát audio nebo video a vybrat NVIDIA Canary z modelového sběrače.
Na standardních referenčních hodnotách dosahuje NVIDIA Canary přibližně 3.5% Word Error Rate. Skutečná přesnost závisí na kvalitě zvuku, přízvuku a jazyku; u hlučných nebo akcentovaných nahrávek očekáváme o několik procentních bodů vyšší WER.
NVIDIA Canary běží na STT.ai volných úrovní, každý návštěvník dostane 600 minut / měsíc bez nákladů. Placené plány přidat déle na-file limity, soukromé přepisy, a prioritní fronty.
NVIDIA Canary je uvolněno pod CC-BY-4.0, povolná open-source licence. Můžete self-host NVIDIA Canary na vašem vlastním hardwaru, nebo použít naši hostitelskou verzi dírky oba jsou komerčně použitelné.
NVIDIA Canary podporuje 4 jazyků. Auto-detekce vybírá správný jazyk pro většinu audio; můžete jej také ručně zadat pro malý výtah přesnosti.
NVIDIA Canary zpracovává audio na cca 45.0x v reálném čase na našich GPU. 1-hodinový audio soubor končí za méně než 1 minut; delší fronta souborů a upozornění e-mailem, když je hotovo.
NVIDIA Canary má 1B parametrů. Větší modely mají tendenci být přesnější, ale pomalejší; STT.ai hostů NVIDIA Canary na GPU, takže počet parametrů nemá vliv na výkon na straně klienta.
NVIDIA Canary přijímá každý formát STT.ai podporuje MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI a další. Výstup jako TXT, SRT, VTT, DOCX, JSON, nebo PDF.
Ano. Diarizace reproduktorů vede vedle NVIDIA Canary pro každý přepis a každý reproduktor je označen a můžete je přejmenovat v editoru později.
Ano. NVIDIA Canary běží v našem řízeném prostředí Audio je zpracováno a smazáno ve výchozím nastavení a nikdy se nepoužívá pro trénink bez explicitního opt-inu. Pro plány přidat klient-strana šifrování pro přepisy v klidu.
Pomocí porovná-stt nástroj spustit NVIDIA Canary proti jakémukoliv jinému podporovanému modelu na stejném zvuku, budete vidět WER, počet segmentů, reproduktory štítky, a sebedůvěry skóre vedle sebe. NVIDIA Canary vs Whisper Large V3 srovnání je nejčastějším spuštěním.
Ano. Zadejte "nvidia-canary" jako parametr modelu na cílovém parametru /v1/transcribe. Python a Node.js SDKs obsahují NVIDIA Canary příklady. Bezplatná úroveň API zahrnuje 100 minut/měsíc.
Ano. Vzhledem k tomu, NVIDIA Canary je CC-BY-4.0-licencován, můžete si ho sami-hostit. STT.ai open-source stránky uvádí projekt repo a váhy. Většina výrobních týmů používá naši hostitelskou verzi přeskočit GPU zadávání zakázek, modelové swapy, a ops.