Transcribe with NVIDIA Canary

Radi sa javno dostupnim audio i video sadržajima. DRM-zaštićeni sadržaji nisu podržani.

Nadogradnja za poboljšano
Private transcript
Chat sa transkriptom
Otključaj sa Pro →
Ispusti datoteku ovdje ili klikni za pregledavanje
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — do 2GB
Nadogradnja za poboljšano
Private transcript
Chat sa transkriptom
Otključaj sa Pro →
Nadogradnja za poboljšano
Snimanje: 0:00
U stvarnom vremenu Vosak (trenutno)
Poboljšano Šepni (precizno)
2017.  Službena stranica (en) 24h. · Prijavite se for 7d + audio · Pro za privatne veze

Govor u tekst u realnom vremenu. AI automatski ispravlja dok govorite - tačnost se poboljšava s dužim govorom.

Prvo provjeri mikrofon
❤️ Volite STT.ai?
Koristio si svoje besplatne transkripte.

Registrirajte se besplatno da biste dobili 600 minuta mjesečno, ili nadogradite za neograničene transkripcije.

10 slobodnih minuta/dan 600 min besplatno uz prijavu Nema kreditne kartice Kriptirano
Prijavite se besplatno →
3.5%
WER
4
Languages
45.0x
Speed
CC-BY-4.0
License

About NVIDIA Canary

Languages Supported by NVIDIA Canary

Često postavljana pitanja

STT.ai je domaćin NVIDIA Canary na našoj GPU infrastrukturi tako da ga možete koristiti bez da osigurate svoj vlastiti hardver — uploadati audio ili video i izabrati NVIDIA Canary iz birača modela.

Na standardnim benchmarkima, NVIDIA Canary postiže oko 3.5% stope greške riječi. realna tačnost zavisi od kvaliteta zvuka, naglaska i jezika; za bučne ili naglašene snimke, očekujte nekoliko postotnih bodova više WER.

NVIDIA Canary radi na STT.ai-ovom besplatnom nivou - svaki posjetilac dobiva 600 minuta/mjesečno bez troškova. plaćeni planovi dodaju dulje ograničenje po datoteci, privatne transkripte i prioritetno redoslijed.

NVIDIA Canary je objavljen pod CC-BY-4.0, dozvoljenom licencom otvorenog koda.Možete sami hostati NVIDIA Canary na svom hardveru ili koristiti našu hosted verziju — obje su komercijalno upotrebljive.

NVIDIA Canary podržava 4 jezika. Automatsko otkrivanje bira ispravan jezik za većinu audio; također ga možete ručno odrediti za malo povećanje tačnosti.

NVIDIA Canary obrađuje audio na oko 45.0x real-time na našim GPU-ovima. 1-satna audio datoteka završava za manje od 1 minuta; dulje datoteke čekaju i obavještavaju e-mailom kada je završeno.

NVIDIA Canary ima 1B parametra. Veći modeli imaju tendenciju da budu precizniji ali sporiji; STT.ai hosta NVIDIA Canary na GPU tako da broj parametara ne utječe na performanse klijenta.

NVIDIA Canary prihvaća svaki format koji podržava STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI i drugi. izlaz kao TXT, SRT, VTT, DOCX, JSON, ili PDF.

Da. Diarizacija govornika radi zajedno sa NVIDIA Canary za svaku transkripciju - svaki govornik je označen i možete ih preimenovati u editoru kasnije.

Da. NVIDIA Canary radi u našoj upravljanoj okolini — audio se obrađuje i briše po zadanim postavkama i nikada se ne koristi za trening bez eksplicitnog uključivanja. Pro planovi dodaju šifriranje na strani klijenta za transkripte u mirovanju.

Koristite compare-stt alat da pokrenete NVIDIA Canary protiv bilo kojeg drugog podržanog modela na istom audio — vidjet ćete WER, broj segmenata, oznake zvučnika, i pouzdanost ocjena jedan pored drugog. NVIDIA Canary vs Whisper Large V3 usporedba je najčešća.

Da. Navedite "nvidia-canary" kao modelni parametar na /v1/transcribe krajnjoj tački. Python i Node.js SDK-ovi uključuju NVIDIA Canary primjere. Besplatni API nivo uključuje 100 minuta/mjesečno.

Da. Budući da je NVIDIA Canary licenciran za CC-BY-4.0, možete ga sami postaviti. Stranica otvorenog koda za STT.ai navodi projektni repozitorij i težine. Većina produkcijskih timova koristi našu verziju za preskakanje nabavke GPU-a, zamjene modela i operacija.