Transcribe with NVIDIA Canary

Működik nyilvánosan elérhető audio & video. DRM-védett tartalom nem támogatott.

Frissítés a továbbfejlesztett
Private transcript
Csevegés átirattal
Kinyitni a Pro-val →
Drop fájl itt vagy kattintson a böngészésre
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM maximum 2GB
Több fájl feltöltése (lásd 4. 4 pont)
Frissítés a továbbfejlesztett
Private transcript
Csevegés átirattal
Kinyitni a Pro-val →
Frissítés a továbbfejlesztett
Felvétel: 0:00
Valós idejű Vosk (instant)
Továbbfejlesztett@ info: whatsthis Suttogó (pontos)
Nyilvános linkek: 24h, csak szöveg · Regisztrálj! 7d + audio · Pro magánkapcsolatok esetében

Valós idejű beszéd szöveg. AI automatikus javítások, ahogy beszél A pontosság hosszabb beszéddel javul.

Először teszteld a mikrofonodat.
❤️ Love STT.ai? Tell your friends!
Használtad az ingyenes átirataidat.

Regisztráljon ingyenes, hogy 600 perc / hónap, vagy frissítés korlátlan átiratok.

10 ingyenes min/nap 600 perc ingyenes regisztrációval Nincs hitelkártyája. Titkosított
Regisztrálj ingyen! →
3.5%
WER
4
Languages
45.0x
Speed
CC-BY-4.0
License

About NVIDIA Canary

Languages Supported by NVIDIA Canary

Gyakran ismételt kérdések

NVIDIA Canary egy beszéd-to-text modell NVIDIA, STT.ai hosts NVIDIA Canary a mi GPU infrastruktúra, így használhatja anélkül, hogy a saját hardvere feltölti audio vagy videó, és vegye NVIDIA Canary a modell picker.

A standard referenciaértékek, NVIDIA Canary eléri mintegy 3.5%-os Word Error Rate. A valós világ pontossága függ a hangminőség, az akcentus és a nyelv; a zajos vagy kihangsúlyozott felvételek, számíthat néhány százalékponttal magasabb WER.

NVIDIA Canary fut a STT.ai's free level -on minden látogató kap 600 percet/hót ingyen. Fizetett tervek hozzá hosszabb per-file limitek, privát átiratok, és elsőbbségi sorban.

NVIDIA Canary kerül kiadásra CC-BY-4.0, egy engedékeny nyílt forráskódú licenc. Önálló NVIDIA Canary saját hardveren, vagy használja a mi hosted verziónk mind kereskedelmileg használható.

NVIDIA Canary támogatja a 4 nyelvet. Auto-detection kiválasztja a megfelelő nyelvet a legtöbb audio; akkor is megadhatja manuálisan egy kis pontosságú lift.

NVIDIA Canary audiót készít körülbelül 45.0x valós idejű GPU-n. Egy 1 órás audio fájl 1 perc alatt fejeződik be; hosszabb fájlok sorba állnak, és e-mailben értesítik őket.

NVIDIA Canary van 1B paraméterek. Nagyobb modellek általában pontosabb, de lassabb; STT.ai hosts NVIDIA Canary a GPU, így a paraméterszám nem befolyásolja az ügyfél-oldal teljesítményét.

NVIDIA Canary minden formátumot elfogad, STT.ai támogatja az MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI és mások. Kimeneti mint TXT, SRT, VTT, DOCX, JSON, vagy PDF.

Igen. A szónoki diarization NVIDIA Canary-rel együtt fut minden egyes átirathoz ~ minden hangszórót felcímkéznek, és utána átnevezheted őket a szerkesztőbe.

Igen. NVIDIA Canary fut a mi kezelt környezetben Audio feldolgozzák és törölték alapértelmezésben, és soha nem használják képzés kifejezett opt-in nélkül. Pro tervek hozzá kliens-oldal titkosítását átiratok pihenni.

Használja a összehasonlítani-stt eszköz futtatni NVIDIA Canary ellen bármely más támogatott modell ugyanazon audio ★ látni fogja WER, szegmensszám, hangszóró címkék, és a konfidencia pontszámok oldalról oldalra. A NVIDIA Canary vs Whisper Large V3 összehasonlítás a leggyakrabban fut.

Igen. A Python és a Node.js SDK-k NVIDIA Canary példát tartalmaznak. A Free API-szint 100 percet/hónapot tartalmaz.

Igen. Mivel a NVIDIA Canary CC-BY-4.0 engedéllyel rendelkezik, saját maga is üzemeltetheti. STT.ai nyílt forráskódú oldala felsorolja a projekt repo- és súlyait. A legtöbb gyártócsapat a GPU beszerzések, modellswapok és op-ok kihagyására használja a hostált verziónkat.