Transcribe with NVIDIA Canary

Deluje z javno dostopno avdio & video. Vsebnost, zaščitena z DRM, ni podprta.

Nadgradnja za izboljšano
Private transcript
Klepetaj s prepisom
Odkleni z Pro →
Izpusti datoteko ali klikni za brskanje
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM – do 2GB
Nadgradnja za izboljšano
Private transcript
Klepetaj s prepisom
Odkleni z Pro →
Nadgradnja za izboljšano
Snemanje: 0:00
Realnočasovno Vosk (instant)
Izboljšano Šapetanje (natančno)
Javne povezave: 24h, samo besedilo · Vpišite se. za 7d + zvok · Prof. za zasebne povezave

Govor v realnem času na besedilo. AI avto-popravki, ko govorite – natančnost se izboljša z daljšim govorom.

Najprej preizkusite mikrofon.
❤️ Ljubezen STT.ai, povej prijateljem!
Uporabili ste svoje brezplačne transkripcije.

Prijavite se brezplačno, da dobite 600 minut/mesec, ali nadgradnjo za neomejene transkripcije.

10 brezplačnih min/dan 600 min brez prijave Brez kreditne kartice Šifrirano
Vpišite se brezplačno →
3.5%
WER
4
Languages
45.0x
Speed
CC-BY-4.0
License

About NVIDIA Canary

Languages Supported by NVIDIA Canary

Pogosta vprašanja

NVIDIA Canary je model govora v tekst z NVIDIA. STT.ai gostiteljev NVIDIA Canary na naši infrastrukturi GPU, tako da ga lahko uporabite, ne da bi zagotovili svojo lastno strojno opremo – naložite zvok ali video in izberite NVIDIA Canary iz izbirnika modela.

Na standardnih merilih dosega NVIDIA Canary približno 3.5% Word Napaka. Resnična natančnost je odvisna od kakovosti zvoka, naglasa in jezika; za glasne ali naglašene posnetke, pričakujemo nekaj odstotnih točk višje WER.

NVIDIA Canary teče na brezplačni stopnji STT.ai – vsak obiskovalec dobi 600 minut/mesečno brez stroškov. Plačani načrti dodajajo več mejnih vrednosti za datoteko, zasebne transkripte in prednostne redke.

NVIDIA Canary je sproščeno pod CC-BY-4.0, popustljivo dovoljenje odprtega izvora. Lahko samostojno gostite NVIDIA Canary na lastni strojnici ali uporabite našo gostiteljsko različico – oba sta komercialno uporabna.

NVIDIA Canary podpira 4 jezikov. Samodejno odkrivanje izbere pravi jezik za večino avdio; lahko ga tudi ročno navedete za majhno natančnost dvigala.

NVIDIA Canary procesov avdio ob približno 45.0x v realnem času na naši GPU. 1 urni zvočni datoteka konča v manj kot 8802 minut; daljši datoteki v vrstici in obveščanje po e-pošti, ko se opravi.

NVIDIA Canary ima STT.ai2 parametrov. Večji modeli so običajno bolj natančni, vendar počasnejši; STT.ai gostiteljev NVIDIA Canary na GPU, tako da število parametrov ne vpliva na učinkovitost vašega stranke.

NVIDIA Canary sprejema vse oblike STT.ai podpor – MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI in drugi. Izhod kot TXT, SRT, VTT, DOCX, JSON ali PDF.

Ja. Zvočniška diarizacija teče skupaj z NVIDIA Canary za vsako transkripcijo – vsak zvočnik je označen in jih lahko kasneje preimenujete v uredniku.

Da. NVIDIA Canary teče v našem upravljanem okolju – zvok se obdeluje in briše privzeto in nikoli ne uporablja za usposabljanje brez izrecne opt-in. Pro načrti dodati stran stranke šifriranje za transkripte v počitek.

Uporabite orodje primerjave-st, da teče NVIDIA Canary proti kateremu koli drugemu podprti model na istem zvoku – boste videli WER, segment število, zvočnike, in samozavestne rezultate stran ob strani. Primerjava NVIDIA Canary vs Whisper Large V3 je najpogostejši zagon.

Da. Navedite "nvidia-canary" kot parametr modela na /v1/transcribe end. Python in Node.js SDKs vključujejo NVIDIA Canary primerov. Brezplačni API stopnja vključuje 100 minut/mesec.

Da. Ker je NVIDIA Canary CC-BY-4.0-licenzirano, ga lahko samostojno gostite. STT.ai odprtih strani na seznamu projekta repo in uteži. Večina proizvodnih ekip uporablja našo gostiteljsko različico za preskočitev naročanja GPU, modeli zamenjave in ops.